Nvidia оптимизировать для вычислений
Дмитрий Чехлов. Автор многочисленных публикаций, посвященных компьютерной графике и 3D-технологиям, автор книги "Визуализация в Autodesk Maya: mental ray renderer" , художник по освещению и затенению, технический специалист в области компьютерной визуализации, Активист Autodesk Community, Autodesk Certified Professional, участник программ Autodesk Developer Network и NVIDIA Partner Network. Довольно часто мне приходится отвечать на вопрос, в чем разница между игровой графикой и профессиональной. В этой статье я расскажу о преимуществах профессиональной графики при работе с профессиональными приложениями.
Поиск данных по Вашему запросу:
По завершению появится ссылка для доступа к найденным материалам.
Содержание:
Вы точно человек?
Дмитрий Чехлов. Автор многочисленных публикаций, посвященных компьютерной графике и 3D-технологиям, автор книги "Визуализация в Autodesk Maya: mental ray renderer" , художник по освещению и затенению, технический специалист в области компьютерной визуализации, Активист Autodesk Community, Autodesk Certified Professional, участник программ Autodesk Developer Network и NVIDIA Partner Network. Довольно часто мне приходится отвечать на вопрос, в чем разница между игровой графикой и профессиональной.
В этой статье я расскажу о преимуществах профессиональной графики при работе с профессиональными приложениями. Речь пойдет не о производительности, а о поддержке специфических функций, востребованных в приложениях САПР и для создания мультимедийного контента. Наше знакомство с возможностями профессиональной графики и сравнение с возможностями игровой графики мы начнем с поддержки высокого сглаживания краев геометрии и линий. В отличие от игровых приложений, где высокое качество сглаживания может увеличить время визуализации кадра в профессиональных приложениях решается иная задача — качество выводимого изображения.
Чем выше качество сглаживания линий и краев геометрии, тем легче анализировать модель или чертеж, определять детали и элементы сборок, и многое другое. Наиболее часто используется метод multisampling antialiasing. Он достаточно прост и доступен в библиотеках всех графических API.
Однако для повышения качества сглаживания и устранения "ступенчатости" в гранях и линиях может потребоваться применение не только базовых методик сглаживания, но также и расширенных алгоритмов, позволяющих улучшать качество изображения.
Драйверы профессиональных карт Quadro предоставляют возможность выбирать в панели управления высокий уровень сглаживания — до 64х. На практике это дает существенно лучшее восприятие множества линий и границ объектов в сцене.
На игровых видеокартах GeForce такие уровни сглаживания просто недоступны. Здесь я хочу сделать небольшую ремарку. Поддержка сглаживания 64x может быть недоступна только в ряде некоторых графических ядер современных приложений. Многие разработчики стараются самостоятельно реализовать сглаживание линий и геометрии независимо от управления данной функцией со стороны драйвера. В отличие от игровых графических ускорителей, в профессиональных ускорителях реализованы улучшенные методики обработки геометрии.
Это позволяет значительно увеличить производительность в процессе воспроизведения анимации и загрузить в память все необходимые данные. Но для того, чтобы обрабатывать большое количество текстурных карт и реализовывать поддержку карт с высоким разрешением до 16K , необходим другой подход при работе с графической памятью. Память графического ускорителя играет важную роль в обеспечении высокой производительности. Это один из ключевых показателей возможностей GPU.
Такие возможности графических ядер, как кэширование геометрии и запись данных напрямую в графическую память, при достаточном объеме предоставляет гибкие возможности для воспроизведения анимации и интерактивного перемещения в сложных сценах без снижения производительности. Большие объемы памяти особенно важны в работе с GPU-ускоренными движками визуализации и такими технологиями, как Alembic, и интерактивными приложениями для презентационной визуализации напр.
Autodesk VRED. Важной функцией при работе с памятью является её очистка для последующих задач или оптимальное использование для хранения данных. В профессиональных графических ускорителях память используется более равномерно, чем в игровых решениях. Это обусловлено максимально сбалансированной работой программного обеспечения и драйвера GPU, а также возможностям очистки памяти реализованной в нем.
В зависимости от проектов объем данных может варьироваться, а в ряде случаев может быть колоссален по определению, профессиональные карты традиционно оснащаются большим объемом памяти. Только среди профессиональных ускорителей есть возможность использовать до 24 Гб памяти, которые помогают работать с текстурами, моделями, данными любой сложности и хранить их, не опираясь на создание резервного кэша.
Мы провели тест на использование памяти профессиональными GPU. Основная его задача заключалась в отслеживании использования графической памяти в процессе моделирования трехмерной геометрии. В процессе загрузки сцены и текстурных карт графическое ядро приложения старается полностью использовать память. В большинстве случаев 2 — 4 Гб графической памяти достаточно для работы над моделями средней сложности. С другой стороны, когда сцена содержит больше объектов и текстур, требования к объемам и возможностям памяти возрастают и могут потребоваться объемы в 8, 12 и более Гб, а так же повышаются требования к её рациональному использованию.
Рисунок ниже демонстрирует пример того, какой объем памяти используется при загрузке модели в пакете Autodesk Maya Так как в драйвере выбрано автоматическое распределение ресурсов GPU, графическое ядро программы отдало приоритет GPU с большим объемом памяти. И пример использования памяти при активизации режима отображения текстурных карт.
На диаграмме в Performance Monitor вы можете видеть, какой объем памяти требуется для хранения модели вагона. Когда активизируется режим отображения текстурных карт, все используемые в сцене и в шейдерах модели текстуры будут загружены в память графического процессора. Но в отличие от игровых графических процессоров, память профессиональных графических процессоров используется более рационально.
Когда данные не нужны, они будут выгружены из памяти и загружены обратно только тогда, когда это необходимо. Если же выполняется копирование геометрии и модели, нет необходимости в создании дубликатов данных в графической памяти, легче создать взаимосвязанные образцы и использовать их.
Обратите внимание, что объем памяти немного меняется, увеличиваясь, а затем доходит до прежнего уровня. При этом, в сцене содержится больше объектов и экземпляров текстурных карт.
Пример использования памяти при создании дубликатов геометрии и шейдеров с текстурами. Оптимизация работы памяти на профессиональных графических ускорителях достигается за счет оптимизации графических ядер на основе расширений API OpenGL и Direct3D. Одним из серьезных недостатков игровой графики является отсутствие функций для создания и управления рабочими столами.
Обычно это решается с помощью реализованных в ОС функций или сторонних решений. Это накладывает множество ограничений. Но пользователи профессиональных ускорителей не имеют таких ограничений и могут использовать как функционал от NVIDIA, так и предоставляемые операционной системой функции.
Таким образом, можно выполнять огромное количество комбинаций рабочих пространств на любой вкус. В отличие от игровых решений, профессиональные карты Quadro предоставляют инструменты для управления рабочими столами и их конфигурациями. Пример применения nView Desktop Management для управления тремя рабочими столами. Рабочие столы могут быть разбиты с помощью сетки, в каждую ячейку которой может быть помещено окно всего приложения или его отдельный диалог. На практике это очень удобно, особенно при работе с многооконными приложениями, где требуется организовать множество диалогов или буферов кадров.
На рисунке ниже приведен пример организации нескольких окон с помощью разбивки по сетке. Пример применения функции Guideline Editor для распределения диалоговых окон приложений. Еще одна полезная функция — привязка к границам экрана. В отличие от стандартной реализации в операционных системах Windows и Linux. Благодаря инструментарию nView Desktop Management, вы можете настроить определение границ экрана и действие окон приложения в процессе операций с ними. Функции Windows Manager позволяют пользователю лучше управлять окнами приложений.
А если в ваши задачи входит администрирование нескольких удаленных компьютеров, подключение к ним и сбор данных произойдет гораздо быстрее, если использовать возможности локальной сети. На рисунке выше приведен пример мониторинга производительности графических процессоров с помощью MMC, куда могут быть добавлены счетчики с помощью соответствующего диалога.
Также, в отличие от игровых видеокарт, в профессиональных GPU реализована возможность конфигурации под определенные задачи. Данная утилита также доступна и для некоторых моделей игровых графических ускорителей, к ним относятся модели выпускаемые под брендом GTX Titan.
Но функционал в данном случае будет сильно ограничен. При возрастающем объеме данных, содержащихся в комплексных моделях, для достижения высокой скорости визуализации необходимо применение производительных GPU. При конфигурации вы можете выбирать, какой из доступных GPU будет использоваться для работы только с графикой, а какой для работы с графикой и вычислений.
В драйвере для игровых графических ускорителей вы можете выбирать только графический процессор для вычислений в CUDA-приложениях. Что существенно ограничивает пользователя в конфигурации. Рассмотрим наглядный пример настройки графических процессоров для распределения задач между вычислениями и визуализацией окон проекций на примере Autodesk 3ds Max и NVIDIA iray renderer. По умолчанию, 3ds Max и Iray используют все доступные графические процессоры. Обычно тот GPU, который используется операционной системой, будет не активен в Iray, а сам 3ds Max использует его для визуализации виртуального пространства.
С другой стороны, если выполнить соответствующую конфигурацию драйвера, тот GPU, который не будет активен, не будет отображаться в списке доступных для визуализации в Iray устройств. Рассматриваемое условие доступно для всех приложений, требующих распределения нагрузки между несколькими графическими процессорами. Это могут быть САПР, использующие графический процессор для ускорения вычислений и для визуализации, это могут быть мультидисплейные системы, когда множество дисплеев отображают информацию, а дополнительные графические процессоры выполняют вычисления в CUDA или OpenCL приложениях.
Основной упор мы делали на качестве изображения и производительности графического ядра при визуализации параметрической модели в виртуальном пространстве, использование ресурсов графических процессоров и выполнении вычислений общего назначения. Производительность такого программного обеспечения, как САПР, зависит от множества факторов. Результат выполняемых пользователем операций, вычисляется центральным процессором, а повторное вычисление всей модели может потребовать времени.
Графические ускорители выполняют задачи связанные с визуализацией векторных данных параметрической модели, полученной в процессе вычислений с помощью центрального процессора и хранимой в оперативной памяти. Помимо этого, на протяжении нескольких лет компанией NVIDIA и её партнерами по консорциуму Khronos Group ведется разработка расширений для Open GL, позволяющих выполнять оптимизацию производительности приложений.
Многие профессиональные графические приложения и их ядра начинают использовать возможности этих расширений для увеличения производительности.
Ключевая идея заключается в минимизации простоя в процессе вычислений, выполняемых на CPU и передаваемых GPU для визуализации. По своей сути, графический процессор не будет ожидать данные, которые к нему поступают после вычислений на CPU, и промежуток времени, в который GPU бездействует, будет заполнен определенными задачами, например вычислениями.
Пример распределения задач между множеством потоков в процессе обработки сцены. На рисунке приведен пример профилирования сцены Autodesk Maya в процессе воспроизведения анимации.
Каждый из голубых блоков — задачи, связанные с визуализацией силами Viewport 2. В то время, когда выполняются вычисления в процессе трансформации и деформации объектов, графическое ядро программы выполняет визуализацию получаемых от CPU и данных.
Из этого следует значительное повышение производительности в визуализации и вычислениях всей системы в целом. Когда мы снимаем с CPU лишние задачи по вычислениям, его возможности можно использовать для решения последовательных задач, но в то же время, хорошо распараллеливаемые и графические задачи выполняются на GPU. Таким образом, мы получаем прирост производительности графического ядра и приложения в целом. При этом используемая плоскость отсечки также визуализируется с помощью графического ускорителя.
В отличие от других решений, все параметры и контроль качества выполняется с помощью панели управления драйвером, а не через интерфейс приложения. В самом же приложении вы можете выбрать, будет ли использовано аппаратное ускорение или нет. Библиотека OptiX позволяет выполнять трассировку лучей в режиме реального времени и обеспечивает разработчиков необходимыми спецификациями для разработки шейдеров материалов и источников света, а также инструментами интеграции с API OpenGL и Direct3D.
Это удобно, когда необходимо готовить проект в нескольких приложениях и передавать данные из одного приложения в другое. Пакет SolidWorks предоставляет своим пользователям богатый функционал. Его графическое ядро также оптимизировано для работы с профессиональными графическими ускорителями.
Преимущества профессиональной графики NVIDIA Quadro при работе с САПР приложениями
Войдите , пожалуйста. Все сервисы Хабра. Как стать автором. Войти Регистрация. Моделирование происходит как решение задачи Коши — задание значений параметров в начальный момент времени, затем приращение времени и перерасчет всех уравнений, и т. Вычисления происходят в двойной точности double. Модель параметрической неустойчивости ленгмюровских волн в плазме состоит из уравнений амплитуды, фазы, плотности ионов, напряженности электрического поля число уравнений каждого типа равно , уравнений движения ионов, число которых равно , и двух уравнений накачки.
Расширенный поиск драйвера
Как отмечает компания, новый Visual Profiler позволяют разработчикам любого уровня легко оптимизировать свой код для максимальной производительности. Благодаря автоматизированному анализу производительности и системе управления, которая дает пошаговые советы по оптимизации, Visual Profiler определяет узкие места в производительности приложения и предлагает способы их устранения. С новым Visual Profiler проблемы производительности легко находить и устранять. LLVM — это популярная инфраструктура с открытым кодом, имеющая модульный дизайн, который позволяет легко добавлять поддержку новых языков программирования и процессорных архитектур. Обновленную библиотеку NPP можно использовать для широкого спектра алгоритмов обработки изображений и сигналов — от базового фильтрования до передовых технологических процессов. Игры 27 января , Новый Visual Profiler.
NVIDIA EGX – платформа периферийных вычислений для ИИ в индустрии
Эти размеры предназначены для рабочих нагрузок с большим объемом вычислений, графической обработки и визуализаций. These sizes are designed for compute-intensive, graphics-intensive, and visualization workloads. В этой статье содержатся сведения о количестве и типе GPU, виртуальных ЦП, дисков данных и сетевых адаптеров. Кроме того, для каждого размера виртуальной машины этой группы учитывается пропускная способность хранилища и сети.
Закономерности развития видеокарт и графических процессоров
Причем, сразу c поддержкой 64 бит. Такое редко бывает в индустрии, когда происходят положительные изменения сразу в нескольких аспектах. Можно сказать, мы присутствуем при историческом моменте, который можно сравнить с выходом Intel Core 2, заменившем Pentium 4. В более ранней ретроспективе, с выходом первого Pentium. Или с выходом архитектуры Intel x86 на рынок рабочих станций. Это даже можно отчасти сравнить с появлением самих ускорителей компьютерной графики, в первую очередь, игровой графики, которые на долгие годы изменили конфигурацию персонального компьютера.
База знаний
ASUS Workstation — это серия материнских плат, которые предназначены стать фундаментом самых мощных компьютерных систем. Эти платы отличаются повышенной надежностью, высокой производительностью и широким набором интерфейсов. Они снабжены специальным энергетическим процессором, который обеспечивает оптимальное управление энергопотреблением, а их интеллектуальная система охлаждения выполняет свою работу с минимальным шумом. Не подстраивайтесь под компьютер — продукты серии ASUS Workstation сами подстроятся под стиль вашей жизни и работы, улучшив их! В максимальной конфигурации можно получить графическую подсистему с вычислительной мощностью около 4 терафлопов! Материнская плата P6T7 WS SuperComputer позволяет собрать графическую подсистему с двумя или тремя процессорами, а в общей сложности в нее можно установить до четырех видеокарт с двухслотовыми кулерами.
Пожалуйста, подождите Навигация Автомобили и транспорт Военные технологии Информ. Реклама Загрузка Мы в Сети.
Студия Oxide Games стала одной из первых команд, которая провела тестирование возможностей DirectX 12 на примере видеоигр. В компании знали о недочетах работы видеокарт GeForce на DirectX 12 и потребовали от разработчиков убрать из тестов некоторые настройки. По словам главы студии Oxide, представители отдела по связи с общественностью Nvidia стали давить на команду с требованием убрать некоторые настройки тестов DirectX Команда отказалась выполнять требования, поэтому производителю видеокарт пришлось выпустить заявление о том, что тесты, представленные в игре Ashes of the Singularity являются непоказательными. Представители Nvidia сделали несколько некорректных заявлений и в дальнейшем не планируют обсуждать нашу позицию, если вы у них спросите.
Игры против видеокарт 5. CD Projekt и другие польские захватчики игровой индустрии. Знакомство с технологией CUDA В развитии современных процессоров намечается тенденция к постепенному увеличению количества ядер, что повышает их возможности в параллельных вычислениях. Однако уже давно имеются GPU, значительно превосходящие центральные процессоры в данном отношении. И эти возможности графических процессоров уже взяты на заметку некоторыми компаниями. Первые попытки использовать графические ускорители для нецелевых вычислений предпринимались еще с конца х годов.
Форум Темы без ответов Новые сообщения Поиск по форуму. Что нового Новые сообщения Новые сообщения в профиле Недавняя активность. Вход Регистрация.
Я подумал и удалил этот вопрос