Почему vGPU не уступают по производительности «железным» решениям

Решения
Павел Игнатьев
20.06.2019
Количество просмотров
2834
VMware обновили свой гипервизор ESXi. Теперь скорость работы виртуальных графических процессоров под его управлением сопоставима с возможностями их bare metal реализаций — разница составляет всего 3%. Рассказываем, как компании удалось этого добиться.

Что поменяли

ИТ-гигант внес две модификации в конфигурацию ESXi: отключил функцию vMotion и добавил поддержку технологии DirectPath I/O.

Задачей vMotion является балансировка нагрузки — система мигрирует виртуальные машины (ВМ) между серверами. При переносе ВМ местоположение ее файлов не меняется, просто она начинает потреблять ресурсы (память и процессор) другого хоста ESXi. Отключив vMotion, VMware закрепили vGPU за конкретными виртуальными машинами. Такой подход сократил издержки, связанные с передачей данных при миграции, и увеличил общую производительность гипервизора.

Что касается DirectPath I/O, то эта технология напрямую связывает драйвер CUDA (программно-аппаратную архитектуру параллельных вычислений для GPU от Nvidia) с ВМ — в обход гипервизора.

Сам по себе метод DirectPath работает только для связки «одна виртуальная машина — один GPU». Если виртуальной машине требуется большее число ускорителей, то они связываются в единый кластер с помощью технологии FlexDirect (от партнеров VMware — BitFusion). Если же, наоборот, необходимо разделить мощности одного GPU среди нескольких виртуальных машин, то здесь используется технология Nvidia GRID — она делит память карты на независимые сегменты фиксированного размера.

Общую схему работы системы можно представить следующим образом:

Отключили функцию vMotion и добавил поддержку технологии DirectPath I/O

Перспективы

Инженеры VMware протестировали обновленный гипервизор на задаче с обучением языковой модели, используя открытую программную библиотеку для МО TensorFlow. Производительность виртуальных графических процессоров была всего на три-четыре процента меньше, чем у решений bare metal. При этом виртуальная система обладала большим потенциалом к масштабированию.

Производительность vGPU проверили и в работе с контейнерными технологиями. Разработчики ИТ-гиганта разделили ресурсы одного графического процессора между четырьмя контейнерными ВМ и запустили на этой инфраструктуре нейронную сеть для распознавания изображений. В этой ситуации производительность индивидуальных машин снизилась почти на 20% (по сравнению с одной ВМ, имеющей в своем распоряжении все ресурсы графического ускорителя), но при этом в три раза выросло (средний график) число обрабатываемых за секунду изображений.

В VMware говорят, что технология найдет применение в сфере высокопроизводительных вычислений (HPC): ESXi будут использовать для обучения нейросетей, рендеринга, моделирования и проведения симуляций. Пока что для таких нагрузок виртуализация практически не применяется.

Инженеры VMware надеются, что обновленный ESXi поспособствует распространению виртуализированных решений на рынке высокопроизводительных систем. Сегодня виртуализированы порядка 70% рабочих нагрузок в дата-центрах. Оставшиеся 30% по большей части представляют собой HPC-системы, которые работают на bare metal. В Statista говорят, что к 2021 году ситуация изменится и уже 94% рабочих нагрузок дата-центров будут выполняться в виртуальной среде (соответственно, всего 6% будет приходиться на системы без гипервизоров).

Unsplash License

/ фото Thomas Jensen / Unsplash License

Кто еще занимается vGPU

Кроме VMware разработкой технологий виртуализации графических ускорителей занимаются AMD и Intel.

Первый ИТ-гигант разрабатывает технологию SR-IOV. Она делит аппаратные возможности физического устройства между несколькими виртуальными машинами. Хотя основной целью SR-IOV является виртуализация сетевых плат, компания предлагает использовать её для работы с GPU.

Технология уже позволяет разделить ресурсы одного ускорителя между шестнадцатью пользователями, поддерживая равную производительность для каждого из них. Технология Intel строится на базе кросс-платформенного гипервизора Citrix XenServer 7. Она объединяет работу стандартного GPU-драйвера и виртуальной машины. ВМ получает возможность оперировать «тяжелыми» приложениями на устройствах нескольких сотен пользователей одновременно.

Что ждет рынок

Разработчики аппаратного и программного обеспечения для работы с графическими ускорителями делают ставку на рост популярности HPC-решений. Аналитики говорят, что объем продаж аппаратного обеспечения для высокопроизводительных систем составит 45 млрд долларов к 2022 году (с учетом того, что два года назад эта цифра равнялась 32 млрд). ИТ-гиганты надеются, что необходимость обрабатывать крупные объемы данных приведет к росту спроса на vGPU.

При этом разрабатываются технологии, которые повысят производительность виртуальных решений. Инженеры стараются совместить возможности классических и графических процессоров на одном чипе, чтобы получить лучшее от обоих миров. Такие технологии позволят эффективнее выполнять задачи, связанные с графикой и логическими операциями. По словам экспертов, новые объединенные решения изменят подход к виртуализации и распределению виртуальных ресурсов в рамках дата-центров.

Материалы по теме из нашего блога:

Средняя оценка: 0, всего оценок: 0
Поделиться

Только полезные материалы в нашей рассылке

Ошибка подписки

Похожие статьи

Новости рынка
По следам Enabling The Digital Enterprise: анонсы продуктов и технологий VMware на 2016 год
19.02.2015
Количество просмотров
2959

По следам Enabling The Digital Enterprise: анонсы продуктов и технологий VMware на 2016 год

Интересуетесь технологиями виртуализации, хотите знать, что нового компания VMware готовит в своей продуктовой линейке, но не нашли времени на серию онлайн-мероприятий Enabling The Digital Enterprise? Не беда, специально для вас мы подготовили подборку актуальных тем, сосредоточив внимание на новой ИТ-модели и вопросах управления гибридными облаками.
Технологии
Организация блокчейн на VMware vSphere: от теории к практике
25.12.2017
Количество просмотров
2897

Организация блокчейн на VMware vSphere: от теории к практике

Blockchain — это принципиально новая технология, которая в последнее время приковывает к себе все больше внимания. Специалисты из таких отраслей, как финансы, экономика, медицина, логистика, IoT, активно работают над исследовательскими и экспериментальными проектами с использованием блокчейн, поскольку эта технология заточена не только на криптовалюты.
Тенденции
Процессоры для серверов: обсуждаем новинки
28.05.2019
Количество просмотров
2693

Процессоры для серверов: обсуждаем новинки

В этом материале мы расскажем о чипах, представленных мировыми производителями и выполненных по обновленным техпроцессам.

Ваше обращение приняли

Скоро наш менеджер свяжется с вами.
А пока вы можете изучить интересные материалы в нашем блоге.

Подписка оформлена

Скоро отправим вам уведомление о новых материалах.