Почему vGPU не уступают по производительности «железным» решениям

Решения
Павел Игнатьев
20.06.2019
Количество просмотров
2903
VMware обновили свой гипервизор ESXi. Теперь скорость работы виртуальных графических процессоров под его управлением сопоставима с возможностями их bare metal реализаций — разница составляет всего 3%. Рассказываем, как компании удалось этого добиться.

Что поменяли

ИТ-гигант внес две модификации в конфигурацию ESXi: отключил функцию vMotion и добавил поддержку технологии DirectPath I/O.

Задачей vMotion является балансировка нагрузки — система мигрирует виртуальные машины (ВМ) между серверами. При переносе ВМ местоположение ее файлов не меняется, просто она начинает потреблять ресурсы (память и процессор) другого хоста ESXi. Отключив vMotion, VMware закрепили vGPU за конкретными виртуальными машинами. Такой подход сократил издержки, связанные с передачей данных при миграции, и увеличил общую производительность гипервизора.

Что касается DirectPath I/O, то эта технология напрямую связывает драйвер CUDA (программно-аппаратную архитектуру параллельных вычислений для GPU от Nvidia) с ВМ — в обход гипервизора.

Сам по себе метод DirectPath работает только для связки «одна виртуальная машина — один GPU». Если виртуальной машине требуется большее число ускорителей, то они связываются в единый кластер с помощью технологии FlexDirect (от партнеров VMware — BitFusion). Если же, наоборот, необходимо разделить мощности одного GPU среди нескольких виртуальных машин, то здесь используется технология Nvidia GRID — она делит память карты на независимые сегменты фиксированного размера.

Общую схему работы системы можно представить следующим образом:

Отключили функцию vMotion и добавил поддержку технологии DirectPath I/O

Перспективы

Инженеры VMware протестировали обновленный гипервизор на задаче с обучением языковой модели, используя открытую программную библиотеку для МО TensorFlow. Производительность виртуальных графических процессоров была всего на три-четыре процента меньше, чем у решений bare metal. При этом виртуальная система обладала большим потенциалом к масштабированию.

Производительность vGPU проверили и в работе с контейнерными технологиями. Разработчики ИТ-гиганта разделили ресурсы одного графического процессора между четырьмя контейнерными ВМ и запустили на этой инфраструктуре нейронную сеть для распознавания изображений. В этой ситуации производительность индивидуальных машин снизилась почти на 20% (по сравнению с одной ВМ, имеющей в своем распоряжении все ресурсы графического ускорителя), но при этом в три раза выросло (средний график) число обрабатываемых за секунду изображений.

В VMware говорят, что технология найдет применение в сфере высокопроизводительных вычислений (HPC): ESXi будут использовать для обучения нейросетей, рендеринга, моделирования и проведения симуляций. Пока что для таких нагрузок виртуализация практически не применяется.

Инженеры VMware надеются, что обновленный ESXi поспособствует распространению виртуализированных решений на рынке высокопроизводительных систем. Сегодня виртуализированы порядка 70% рабочих нагрузок в дата-центрах. Оставшиеся 30% по большей части представляют собой HPC-системы, которые работают на bare metal. В Statista говорят, что к 2021 году ситуация изменится и уже 94% рабочих нагрузок дата-центров будут выполняться в виртуальной среде (соответственно, всего 6% будет приходиться на системы без гипервизоров).

Unsplash License

/ фото Thomas Jensen / Unsplash License

Кто еще занимается vGPU

Кроме VMware разработкой технологий виртуализации графических ускорителей занимаются AMD и Intel.

Первый ИТ-гигант разрабатывает технологию SR-IOV. Она делит аппаратные возможности физического устройства между несколькими виртуальными машинами. Хотя основной целью SR-IOV является виртуализация сетевых плат, компания предлагает использовать её для работы с GPU.

Технология уже позволяет разделить ресурсы одного ускорителя между шестнадцатью пользователями, поддерживая равную производительность для каждого из них. Технология Intel строится на базе кросс-платформенного гипервизора Citrix XenServer 7. Она объединяет работу стандартного GPU-драйвера и виртуальной машины. ВМ получает возможность оперировать «тяжелыми» приложениями на устройствах нескольких сотен пользователей одновременно.

Что ждет рынок

Разработчики аппаратного и программного обеспечения для работы с графическими ускорителями делают ставку на рост популярности HPC-решений. Аналитики говорят, что объем продаж аппаратного обеспечения для высокопроизводительных систем составит 45 млрд долларов к 2022 году (с учетом того, что два года назад эта цифра равнялась 32 млрд). ИТ-гиганты надеются, что необходимость обрабатывать крупные объемы данных приведет к росту спроса на vGPU.

При этом разрабатываются технологии, которые повысят производительность виртуальных решений. Инженеры стараются совместить возможности классических и графических процессоров на одном чипе, чтобы получить лучшее от обоих миров. Такие технологии позволят эффективнее выполнять задачи, связанные с графикой и логическими операциями. По словам экспертов, новые объединенные решения изменят подход к виртуализации и распределению виртуальных ресурсов в рамках дата-центров.

Материалы по теме из нашего блога:

Средняя оценка: 0, всего оценок: 0
Поделиться

Только полезные материалы в нашей рассылке

Ошибка подписки

Похожие статьи

Первые шаги
Облако или аренда серверных стоек?
25.09.2015
Количество просмотров
3260

Облако или аренда серверных стоек?

Многие компании все еще не уверены, что выбрать для своих задач — виртуальные серверы в облаке или собственное железо.
Технологии
Облачные технологии в строительстве
23.05.2017
Количество просмотров
4045

Облачные технологии в строительстве

Программный комплекс Autodesk Revit, основанный на технологии информационного моделирования зданий (BIM), включает в себя неограниченные возможности проектирования архитектурных элементов, инженерных систем и строительных конструкций. С появлением облачных решений концепция работы с локальными инсталляциями уходит в прошлое: on-premise приложения постепенно сменяются облакоориентированными сервисами. В этой статье мы расскажем о том, как такие решения находят применение в строительном бизнесе.
Процессы
Как импортировать запущенные виртуальные машины в vCloud Director
11.10.2017
Количество просмотров
2608

Как импортировать запущенные виртуальные машины в vCloud Director

В этой статье рассмотрим функции, доступные в vCloud Director 8.10 и 8.20, в частности поговорим об импорте запущенных виртуальных машин в окружение vCloud Director.

Ваше обращение приняли

Скоро наш менеджер свяжется с вами.
А пока вы можете изучить интересные материалы в нашем блоге.

Подписка оформлена

Скоро отправим вам уведомление о новых материалах.