Casting Simulation Software

все о моделировании литейных процессов

 
 

 

Главная
  Castsoft.ru // Статьи // Использование многоядерных компьютеров для инженерных расчетов в CAE системах

 

Софт

Использование многоядерных компьютеров для инженерных расчетов

в CAE системах

 
 

Источник: CAD/CAM/CAE Observer #8/ (44) / 2008

Автор: Алексей Монастырский (CSoft)

 

 

События

Статьи

Времена, когда предприятия прибегали к компьютерному моделированию технологии (CAE) как к крайнему средству (подобно тому, как вызывают шамана к умирающему больному) безвозвратно уходят. И это хорошо. Компьютерное моделирование настолько прочно внедрилось в современное производство, что стало, фактически, одной из операций технологической цепочки.

Причин этому много: и экономический рост, и востребованность продукции при одновременном повышении требований к ее качеству и просветительская деятельность производителей программного обеспечения и центров технической поддержки.

Еще одну причину хочется упомянуть особо. Это интенсивный рост производительности вычислительной техники. Вспомните, еще совсем недавно компьютеры делились на две категории: «офисные» и «станции» (графические, рабочие и т.п.). Офисными звались компьютеры с «обычной» конфигурацией и производительностью. Они использовались как печатные машинки и были вполне доступны по цене. Программные пакеты, выполняющие различные инженерные расчеты, как правило, не могли быть запущены на таких компьютерах, поскольку используемые в них методы решения требовали значительно большей производительности и объемов памяти. Для работы с ними использовались специальные компьютеры, получившие название «станция». Конфигурация этих машин отличалась тем, что должна была обеспечить максимальную производительность и надежность. При сборке использовались новейшие модели процессоров, плат и т.д. Производителем такой станции не могла быть какая-нибудь никому не известная китайская или тайваньская фирма, как правило, это были серьезные компании: HP, Sun Microsystems, SGI. Стоили такие станции в разы дороже, чем офисные компьютеры. Таким образом, решившись купить дорогой программный продукт, предприятие должно было позаботиться о приобретении не менее дорого оборудования.

Однако, в настоящее время ситуация в корне поменялась. Следующие один за другим прорывы в технологии изготовления различных комплектующих привели к тому, что сегодня самый обычных компьютер (даже стоящий у вас дома) способен выполнить все необходимые инженерные расчеты. Грань между офисным компьютером и станцией стерлась настолько, что даже ноутбук, считавшейся всегда чем-то вроде дорогой игрушки бизнесмена, с легкостью выполняет функции рабочей и графической станции.

Эта доступность (наравне с другими причинами) привела к тому, что сегодня среди слушателей семинаров, посвященных различным вопросам моделирования, количество «пользователей» приближается к количеству «сочувствующих», а иногда и превышает его.

Маловато будет!

Итак, «мирный атом вошел в дом». Моделирование прочно закрепилось на промышленных предприятиях, заняв почетное место как важный, современный и экономичный этап подготовки и анализа производственных процессов. Создаются отделы, набирается инженерный состав. Некоторые предприятия выпустили нормативные документы, регламентирующие отношения между служителями CAE и производственными службами, запретив внедрение технологий, не подтвержденных соответствующими расчетами. Но при этом у моделирования появились и некоторые обязанности, одна из которых – выполнение всех поставленных задач в заданные сроки.

А вот это не так просто. Расчеты, проводимые даже на современных компьютерах, могут длиться несколько дней, и даже недель. Обратимся к примерам. Длительность расчета в системе моделирования процесса литья металлов ProCAST зависит от количества элементов в расчетной модели, качества конечно-элементной сетки и заданных параметров расчета (шаг по времени, количество расчетных полей и т.п.). Предположим, что качество сетки удовлетворяет требованиям алгоритмов и все параметры заданы правильно. Тогда длительность расчета технологического процесса для несложной отливки, включающий стандартный набор решателей (моделируется заполнение формы расплавом, охлаждение и прогноз пористости), составит 2-3 дня в зависимости от количества элементов. Если добавить к стандартному набору решателей расчет напряжений или модель микроструктуры, время расчета увеличится и составит 3-4 дня. И это при условии, что расчет идет стабильно. Если же предположить, что расчетная сетка не совсем хорошего качества, то велика вероятность возникновения проблем с устойчивостью и сходимостью при работе гидродинамического модуля. Это чревато непрогнозируемым увеличением времени расчета или полной его остановкой.

Не следует также забывать, что ситуация, когда первый же сделанный расчет дает ответы на все вопросы встречается в производстве крайне редко. Как правило, требуется провести серию расчетов. А на производстве не редко бывает так, что задание, полученное сегодня, должно быть сделано еще вчера. Поэтому вопрос о сокращении сроков проведения расчетов стоит достаточно остро.

А вот это мой размерчик!

Поскольку наращивать производительность персонального компьютера уже некуда, единственным выходом в сложившейся ситуации будет использование распределенных вычислений или параллельной обработки данных. Цель параллельной обработки – ускорить выполнение вычислений, распределением их на несколько процессоров или компьютеров. Проще говоря, над одним расчетом трудится не один процессор, а два, четыре и т.д. Скорость вычислений при этом действительно возрастает очень существенно, в разы. Есть несколько вариантов реализации процесса параллельной обработки.

 а) Обработка с распределенной памятью

 Обработка с распределенной памятью (Distributed Memory Processing, DMP) – это архитектура, в которой каждый процессор использует свою собственную память (рис. 1). Другими словами это некоторое количество компьютеров, объединенных специальной сетью и работающих под операционной системой Unix/Linux. Такая система компьютеров называется кластером (рис. 2). Запущенная на расчет задача распределяется между компьютерами кластера (узлами кластера), Конфигурация кластера требует наличия высокоскоростной сети между процессорами.

Достоинствами кластерных систем являются их высокая производительность и масштабируемость. Количество компьютеров может наращиваться до практически неограниченных размеров, компьютеры кластера со временем могут быть заменены более современными и производительными (включая многопроцессорные). Покупка кластера, безусловно оправдана при решении задач особой сложности, например при расчете моделей, состоящих из сотен миллионов элементов.

Недостаток применения кластера его высокая стоимость, которая складывается из стоимости одного компьютера, помноженной на количество компьютеров в кластере. Кроме этого требуется создание сети, объединяющей компьютеры в единую систему. Кластер не может стоять в помещении, например, технологического бюро цеха, ему потребуется отдельная комната с микроклиматом, поддерживать работу кластера должен специалист.

 

Рис. 1. Система с распределенной памятью

 

Рис. 2. Вычислительный кластер ПНЦ РАН

 

б) Симметричная многопроцессорная обработка

 При технологии SMP (часто называемой Shared Memory Processing), вычисления распределяются по разным процессорам, которые используют общую память (рис. 3). Ее реализация заключается в покупке одного компьютера с нужным количеством процессоров, каждый из которых может иметь несколько ядер. Применение этой технологии ограничено максимально возможным числом процессоров, которое равно 32.

 

Рис. 3. Симметричная многопроцессорная обработка

 

Главное достоинство такой системы – ее низкая стоимость. Действительно, многоядерные процессоры стоят сегодня даже в ноутбуках. Покупка многопроцессорного и многоядерного системного блока обойдется дешевле, чем покупка соответствующего числа одноядерных машин для организации их в кластер. Кроме этого, не нужно заботиться о качестве и быстродействии сети, отдельном помещении. Многоядерная станция может быть подключена к ЛВС предприятия, что значительно упрощает обмен данными. Использование системы для решения задач инженерного анализа и анализа технологического процесса существенно (в разы) сократит время математического расчета.

Продавая программное обеспечение и оказывая техническую поддержку, часто приходится отвечать на вопросы о способах ускорения процесса моделирования. При этом инженер желает не простого сочувствия вроде «купи новый компьютер», а определенных данных и цифр. Поэтому, было решено сконфигурировать, протестировать и предложить конечному пользователю недорогое, но вместе с тем максимально производительное и удобное с точки зрения использования решение.

 Конфигурация

 За изготовлением образца для тестирования обратились в известную московскую компанию, специализирующуюся на производстве профессиональных графических рабочих станций, высокопроизводительных кластерных решений и систем хранения данных. Вместе с ее специалистами была разработана конфигурация компьютера, на котором планировалось провести серию расчетов в разных режимах.

Для получения максимальной производительности было решено использовать два четырехъядерных процессора Intel® Xeon®, предоставляющих гибкие возможности использования 64- и 32-разрядных приложений и операционных систем. На серверной материнской плате установлено 16 Гб оперативной памяти, что позволит запускать одновременно несколько ресурсоемких расчетов. Для работы с визуализацией результатов и графикой установили видеокарту компании NVIDIA среднего ценового диапазона. Модель Quadro FX 1500 с 256Mb графической памяти это более чем достаточный вариант для работы с CAE системами.

Еще надо сказать несколько слов о жестких дисках. Жесткие диски (и, тем более, их количество) никак не влияют на скорость и производительность расчета. Однако не следует уделять им недостаточно внимания. Каждый расчет, сделанный в CAE системе это гигабайты информации. Их надо где-то хранить. Как правило, требований, предъявляемых к хранению результатов расчета, два: доступность и надежность. Опыт показывает, что архивирование и запись на разные оптические носители (CD, DVD) не приносит желаемых результатов. Чтобы поучить доступ к данным, хранимым таким образом, надо сначала переписать содержимое диска на винчестер, а потом, возможно и разархивировать. На это может уйти до часа времени. Кроме того, надежность оптических носителей довольно сомнительна.

Исходя из вышесказанного, в нашей расчетной станции решено установить пять дисков большой емкости и объединить их в отказоустойчивый дисковый массив RAID 5. Такое решение не только позволит хранить большое количество расчетов, но и обеспечит их сохранность. В случае выхода из строя одного из винчестеров, вся информация будет сохранена и система сохранит свою работоспособность.

Все комплектующие установлены в надежный и красивый корпус с хорошей системой вентиляции и защитой от проникновения посторонних (рис. 4).

 

Рис. 4. Расчетная многоядерная (2´4) станция для проведения расчетов

в системах инженерного анализа

 

 Программное обеспечение

На компьютере установили лицензионную версию операционной системы Microsoft Windows XP Professional x64 Edition. Версия 2003 с обновлением Service Pack 2.

Тестирование проводилось с использованием CAE системы ProCAST (Франция) (рис. 5). Эта система высшего уровня известна на европейском рынке уже более 20 лет. С 2005 года началось продвижение этого продукта в России и СНГ и сейчас система достаточно известна на предприятиях, имеющих литейное производство. Программный комплекс ProCAST предназначен для проведения тепловых, гидродинамических, прочностных и др. расчетов, необходимых для отладки технологии литья изделий. Основная часть модулей использует для расчета метод конечных элементов, есть модули, использующие метод конечных разностей и клеточных автоматов. Последняя на момент тестирования версия продукта 2007.0, имеет в своем составе 32- и 64-разрядные версии решателей. Кроме этого в состав ProCAST 2007.0 входит DMP версия продукта для проведения распределенных вычислений.

 

Рис. 5. Система компьютерного моделирования

литейных процессов ProCAST 2007.0

 

Тестирование

 Для проведения тестовых расчетов использовали модель одного из заказчиков. Расчетная область модели состояла из двух объемов – тела отливки и песчано-глинистой формы. В процессе расчета работали решатели тепловой и гидродинамической задач. Общее количество элементов расчетной области равно 3518121, дополнительные сведения о конечно-элементной модели приведены в таблице 1.

 

Таблица 1

Параметры конечно-элементной модели

Объем

Кол-во Элементов

Использованные решатели

Тепловой

Гидродинамический

Отливка

734558

+

+

Форма

2783563

+

 

Тестирование компьютера проводилось путем расчета одной и той же задачи с использованием разного количества ядер и решателей разной разрядности (32 и 64). По окончании каждого расчета фиксировалось процессорное время (CPU time).

При оценке результатов тестирования вычисляли производительность по формуле:

 

 

В этой формуле  ‑ процессорное время эталонного (базового) расчета. За эталон принято процессорное время, потраченное на расчет той же самой задачи, на ничем не выдающемся, но вполне современном компьютере (двухъядерный ЦПУ 2 ГГц, 2 Гб ОЗУ, Windows XP Pro). Чтобы рассчитать во сколько раз тестируемая задача считается быстрее эталонного расчета надо поделить время базового расчета на время, затраченное на тестовый расчет.

Результаты тестирования представлены в таблице 2 и на рис. 6. Последняя строка в таблице (выделена серым цветом) относится к эталонному расчету.

 

Таблица 2

Результаты тестирования

Кол-во ядер

Разрядность

решателей

Время,

д, ч, мин, с

Производительность

%

раз

8

64

15ч, 56м, 01с

79.2

4.8

4

64

23ч, 52м, 34с

68.8

3.2

2

64

1д, 09ч, 38м, 38с

56.1

2.3

1

64

2д, 23ч, 08м, 35с

7.1

1.08

1

32

2д, 22ч, 20м, 57с

8.1

1.09

1

32

3д, 04ч, 33м, 27с

 

Что можно сказать о результатах этой работы. Наблюдается вполне прогнозируемый рост скорости расчета в зависимости от количества задействованных ядер. Даже аналогичный базовому расчет (1 ядро, 32-разрядные решатели) длится на 6 часов меньше, что вероятно связано и с удачной конфигурацией компьютера, и с использованием 64-разрядной ОС. Подключение к расчету еще одного ядра дает резкий скачок производительности в 2,3 раза по отношению к эталону. Конечно, такая динамика не могла сохраняться при увеличении количества задействованных ядер, но полученный результат все равно впечатлил. Начиная с использования двух и до восьми ядер, рост производительности происходит по линейному закону (рис. 7).

 

Рис. 6. Результаты тестирования

Рис. 7. Характер роста скорости расчета
в зависимости от количества задействованных ядер


По итогам проведенной работы можно сделать следующие выводы. Использование распределенных вычислений дает более чем положительный результат. Расчет, продолжительностью в три дня может быть выполнен в течении 16 часов, т.е. запустив его вечером перед уходом с работы, можно на следующий день уже смотреть результаты.

Сама расчетная станция тоже получилась на удивление удачной. Мощный и относительно недорогой компьютер с большим объемом дискового пространства для хранения результатов.

В завершение скажем, что экспериментальный экземпляр был куплен и трудится в отделе «САПР и инженерного анализа» ЗАО «СиСофт».

 

Расчеты

 

Поддержка

 

Услуги

 

Контакты
   
   
   
   
     

Главная | Софт | События | Статьи | Расчеты | Поддержка | Услуги | Контакты