Почему vGPU не уступают по производительности «железным» решениям

Решения
Павел Игнатьев
20.06.2019
Количество просмотров
3414
VMware обновили свой гипервизор ESXi. Теперь скорость работы виртуальных графических процессоров под его управлением сопоставима с возможностями их bare metal реализаций — разница составляет всего 3%. Рассказываем, как компании удалось этого добиться.

Что поменяли

ИТ-гигант внес две модификации в конфигурацию ESXi: отключил функцию vMotion и добавил поддержку технологии DirectPath I/O.

Задачей vMotion является балансировка нагрузки — система мигрирует виртуальные машины (ВМ) между серверами. При переносе ВМ местоположение ее файлов не меняется, просто она начинает потреблять ресурсы (память и процессор) другого хоста ESXi. Отключив vMotion, VMware закрепили vGPU за конкретными виртуальными машинами. Такой подход сократил издержки, связанные с передачей данных при миграции, и увеличил общую производительность гипервизора.

Что касается DirectPath I/O, то эта технология напрямую связывает драйвер CUDA (программно-аппаратную архитектуру параллельных вычислений для GPU от Nvidia) с ВМ — в обход гипервизора.

Сам по себе метод DirectPath работает только для связки «одна виртуальная машина — один GPU». Если виртуальной машине требуется большее число ускорителей, то они связываются в единый кластер с помощью технологии FlexDirect (от партнеров VMware — BitFusion). Если же, наоборот, необходимо разделить мощности одного GPU среди нескольких виртуальных машин, то здесь используется технология Nvidia GRID — она делит память карты на независимые сегменты фиксированного размера.

Общую схему работы системы можно представить следующим образом:

Отключили функцию vMotion и добавил поддержку технологии DirectPath I/O

Перспективы

Инженеры VMware протестировали обновленный гипервизор на задаче с обучением языковой модели, используя открытую программную библиотеку для МО TensorFlow. Производительность виртуальных графических процессоров была всего на три-четыре процента меньше, чем у решений bare metal. При этом виртуальная система обладала большим потенциалом к масштабированию.

Производительность vGPU проверили и в работе с контейнерными технологиями. Разработчики ИТ-гиганта разделили ресурсы одного графического процессора между четырьмя контейнерными ВМ и запустили на этой инфраструктуре нейронную сеть для распознавания изображений. В этой ситуации производительность индивидуальных машин снизилась почти на 20% (по сравнению с одной ВМ, имеющей в своем распоряжении все ресурсы графического ускорителя), но при этом в три раза выросло (средний график) число обрабатываемых за секунду изображений.

В VMware говорят, что технология найдет применение в сфере высокопроизводительных вычислений (HPC): ESXi будут использовать для обучения нейросетей, рендеринга, моделирования и проведения симуляций. Пока что для таких нагрузок виртуализация практически не применяется.

Инженеры VMware надеются, что обновленный ESXi поспособствует распространению виртуализированных решений на рынке высокопроизводительных систем. Сегодня виртуализированы порядка 70% рабочих нагрузок в дата-центрах. Оставшиеся 30% по большей части представляют собой HPC-системы, которые работают на bare metal. В Statista говорят, что к 2021 году ситуация изменится и уже 94% рабочих нагрузок дата-центров будут выполняться в виртуальной среде (соответственно, всего 6% будет приходиться на системы без гипервизоров).

Unsplash License

/ фото Thomas Jensen / Unsplash License

Кто еще занимается vGPU

Кроме VMware разработкой технологий виртуализации графических ускорителей занимаются AMD и Intel.

Первый ИТ-гигант разрабатывает технологию SR-IOV. Она делит аппаратные возможности физического устройства между несколькими виртуальными машинами. Хотя основной целью SR-IOV является виртуализация сетевых плат, компания предлагает использовать её для работы с GPU.

Технология уже позволяет разделить ресурсы одного ускорителя между шестнадцатью пользователями, поддерживая равную производительность для каждого из них. Технология Intel строится на базе кросс-платформенного гипервизора Citrix XenServer 7. Она объединяет работу стандартного GPU-драйвера и виртуальной машины. ВМ получает возможность оперировать «тяжелыми» приложениями на устройствах нескольких сотен пользователей одновременно.

Что ждет рынок

Разработчики аппаратного и программного обеспечения для работы с графическими ускорителями делают ставку на рост популярности HPC-решений. Аналитики говорят, что объем продаж аппаратного обеспечения для высокопроизводительных систем составит 45 млрд долларов к 2022 году (с учетом того, что два года назад эта цифра равнялась 32 млрд). ИТ-гиганты надеются, что необходимость обрабатывать крупные объемы данных приведет к росту спроса на vGPU.

При этом разрабатываются технологии, которые повысят производительность виртуальных решений. Инженеры стараются совместить возможности классических и графических процессоров на одном чипе, чтобы получить лучшее от обоих миров. Такие технологии позволят эффективнее выполнять задачи, связанные с графикой и логическими операциями. По словам экспертов, новые объединенные решения изменят подход к виртуализации и распределению виртуальных ресурсов в рамках дата-центров.

Материалы по теме из нашего блога:

Средняя оценка: 0, всего оценок: 0
Поделиться

Только полезные материалы в нашей рассылке

Ошибка подписки

Похожие статьи

Безопасность
Особенности размещения государственных информационных систем в облаке
07.07.2017
Количество просмотров
5703

Особенности размещения государственных информационных систем в облаке

 Для размещения в облаке информационной системы, участвующей в обработке, хранении или передаче персональных данных (ИСПДН), необходимо, чтобы инфраструктура IaaS-провайдера была защищена в соответствии с требованиям ФЗ-152 «О защите персональных данных».
Новости рынка
Gartner назвал VMware лидером на рынке виртуализации серверов архитектуры x86
25.08.2016
Количество просмотров
2408

Gartner назвал VMware лидером на рынке виртуализации серверов архитектуры x86

VMware в седьмой раз стала лидером нового «магического квадранта» Gartner 2016 года среди разработчиков решений для виртуализации серверов архитектуры x86.
Истории успеха
Крупный российский ритейлер TOY.RU использует облако «ИТ-ГРАД» для размещения бизнес-критичных систем
17.03.2020
Количество просмотров
5306

Крупный российский ритейлер TOY.RU использует облако «ИТ-ГРАД» для размещения бизнес-критичных систем

Фантастический мир, где сбывается все самое невероятное, открывается не только в сказках, но и в повседневной жизни. Вместе с TOY.RU – одним из крупнейших розничных и интернет-магазинов игрушек, волшебство возможно каждый день. Компания предлагает широкий ассортимент товаров для детей и входит в число передовых ритейлеров, использующих современные технологии. Для каких задач TOY.RU использует облако и каких удалось добиться результатов, расскажем в сегодняшнем материале.

Ваше обращение приняли

Скоро наш менеджер свяжется с вами.
А пока вы можете изучить интересные материалы в нашем блоге.

Подписка оформлена

Скоро отправим вам уведомление о новых материалах.