Как проверить облачную платформу, чек лист «ИТ-ГРАД»

Процессы
Екатерина Юдина
08.04.2020
Количество просмотров
3647
Надежная инфраструктура не должна иметь единой точки отказа. В сегодняшней статье мы расскажем, как удаленно и со стороны аппаратного комплекса провести испытания и убедиться в высоком уровне доступности облака. Каждый этап тестирования мы снабдим описанием теоретически ожидаемого результата и фактическим итогом тестирования облачной платформы. Все способы взяты из личной практики наших специалистов. Поехали!

Удаленное тестирование

Отключение контроллеров NetApp FAS8040

Отключение контроллеров NetApp FAS8040

Ожидание: контроллеры будем отключать по очереди, после отключения должно произойти автоматическое переключение на рабочую ноду, сохранится доступность ресурсов VSM на ESXi, доступ к хранилищам останется стабильным.

В итоге: Автоматически переключилась сначала одна, а затем и потом и вторая нода. При отключении одного контроллера его тома без проблем перешли на второй. Весь процесс длился меньше минуты.

Отключение ISL между свичами

Отключение ISL между свичами

Ожидание: даже если все линки между CN1610 будут загашены, связь между нодами не пострадает.

В итоге: отключение никак не повлияло на связь хоста и сети, для доступа к ESXi использовался второй линк.

Перезагрузка кластерных свичей и Cisco Nexus

Перезагрузка кластерных свичей и Cisco Nexus - 2

Ожидание: перезагружать свичи будем по одному из пары. Наши действия не должны никак повлиять на работу кластера NetApp. По крайней мере один порт на узлах должен быть доступен, на интерфейсах IFGRP всех нод один из интерфейсов 10 GbE останется в доступе, все ресурсы VSM должны быть доступны на ESXi, доступ к датасторам не пострадает.

В итоге: благодаря второму свичу CN1610 кластер контроллеров сохраняет свою целостность. Отключение одного CN1610 не оказывает никакого негативного влияния, перезагрузка Cisco Nexus прошла совершенно безболезненно за счет дублирования и объединения линков в Port Channels.

Выключение одного из Virtual PortChannel на коммутаторе Cisco Nexus

Выключение одного из Virtual PortChannel на коммутаторе Cisco Nexus

Ожидание: фактически этими действиями мы моделируем сбой, при котором на одной из нод NetApp происходит потеря сетевых линков — в такой ситуации все управление должно перейти на другую ноду.

В итоге: после того, как e0b и e0c интерфейсы, в даун ушли IFGRP a0a и VLAN на ней. Затем просто повторилась ситуация, с которой мы столкнулись на первом шаге тестирования — автоматический тейковер ноды.

Выключение одного из Virtual PortChannel на коммутаторе Cisco Nexus - 2

Отключение ISL между коммутаторами Cisco Nexus

Отключение ISL между коммутаторами Cisco Nexus

Ожидание: в результате поочередного отключения связность между Nexus’ами не должна пострадать.

В итоге: Eth1/31 и Eth1/32 агрегированы в PortChannel. Когда один из линков между коммутаторами падает, агрегация каналов не позволяет потерять связность между коммутаторами.

Отключение ISL между коммутаторами Cisco Nexus - 2

Горячее отключение рабочих ESXi-хостов

Горячее отключение рабочих ESXi-хостов

Ожидание: моделируем падение рабочего ESXi-хоста, на котором в момент отключения работало несколько ВМ с разными операционными системами. В идеальной ситуации после падения хоста все машины с него должны перезапуститься на рабочем ESXi-хосте. 

В итоге: после отключения одного из хостов отработал VMware High , и все виртуальные машины перешли на рабочий хост. Процесс занял около 5 минут.

Тестирование отработки системы мониторинга

Ожидание: в результате проведения тестов над мониторингом предполагаем закономерный исход — поток сообщений об ошибках.

В итоге: получение огромного количества ошибок и предупреждений. Система мониторинга активно посылала сообщения в Service Desk, а ITSM-система анализировала эти сообщения по шаблонам и генерировала события. Одинаковые события автоматически собирались в инциденты.

Тестирование отработки системы мониторинга

Тестирование отработки системы мониторинга - 2

Тестирование отработки системы мониторинга - 3

Тестирование непосредственно на стороне аппаратного комплекса

Тестирование непосредственно на стороне аппаратного комплекса

Ожидание: отключаем кабели на всех единых оборудования — они должны продолжить работу от второго блока питания, проблем при переключении между блоками возникнуть не предполагается. 

В итоге: NetApp “доложил” и о себе, и о  Interconnect свичах. Ошибки хостов ожидаемо появились в vSphere. Ни одна единица оборудования не пострадала в результате отключения кабелей питания.

Отключение кабелей питания

На Clusternet свиче:

На Clusternet свиче

Ошибки в vSphere:

Ошибки в vSphere

Поочередное отключение сетевых линков от ESXi

Поочередное отключение сетевых линков от ESXi

Ожидание: при отключении одного сетевого линка ESXi должен оставаться доступен по второму.

В итоге: ситуация полностью соответствует ожиданиям. Отключение сетевого линка не нарушило коннект между хостом и датастором, ESXi остался доступен по второму линку.

Все испытания пройдены! Результаты тестирования прямо говорят о том, что оборудование подключено, смонтировано и настроено правильно, облачная платформа готова к развертыванию виртуальной инфраструктуры для клиентов. Читатели статьи могут взять вышеприведенные тесты для проведения собственных испытаний. 

Средняя оценка: 0, всего оценок: 0
Поделиться

Только полезные материалы в нашей рассылке

Ошибка подписки

Похожие статьи

Новости рынка
«ИТ-ГРАД» поздравляет с прошедшими праздниками и подводит итоги 2017 года
12.01.2018
Количество просмотров
1409

«ИТ-ГРАД» поздравляет с прошедшими праздниками и подводит итоги 2017 года

Наши горячо любимые читатели, коллеги, партнеры!
Технологии
Что такое встроенные контейнеры vSphere и для чего создаются VCH
15.12.2015
Количество просмотров
4344

Что такое встроенные контейнеры vSphere и для чего создаются VCH

Сегодня о контейнерной реализации не говорит только ленивый. Нам обещают, что за ней настоящее и будущее, а многие крупные игроки рынка виртуализации демонстрируют уже готовые решения либо заявляют о скором их появлении.
Первые шаги
Плюсы и минусы облачных сервисов в модели IaaS, PaaS, SaaS: мнение экспертов
27.06.2017
Количество просмотров
5243

Плюсы и минусы облачных сервисов в модели IaaS, PaaS, SaaS: мнение экспертов

Stratoscale – зарубежный провайдер облачной инфраструктуры – подготовил материал о плюсах и минусах использования облачных технологий. Опросив 32 ИТ-специалиста из различных компаний, удалось собрать экспертные мнения и выяснить, чем хороши и плохи услуги, предоставляемые в модели IaaS, PaaS, SaaS.

Ваше обращение приняли

Скоро наш менеджер свяжется с вами.
А пока вы можете изучить интересные материалы в нашем блоге.

Подписка оформлена

Скоро отправим вам уведомление о новых материалах.