Nutanix HCI - альтернатива классической SAN архитектуре

  • 13.02.2024
  • 44

Автор
Иван Первицкий (NCSE, VCP, MCSE)

Ведущий системный инженер


Оглавление

Высокая отказоустойчивость Nutanix

Если в общем о гиперконвергенции (HCI). Существует всего 2 вендора, которые предлагают подобные решения корпоративного класса (нормальные по функционалу и надежности) – Nutanix HCI и VMware с продуктом vSAN.

Если сравнивать, то Nutanix смотрится выигрышнее. Меньше ручной работы, проще и быстрее переживает отказы компонент.

Суть проста: Nutanix это одна ВМ на каждом хосте. В этих ВМ вся логика по организации распределенного хранилища. Каждый блок хранится дважды или трижды и распределяется по всем узлам равномерно.

Вот скрин из презентации, где на каждом узле работает ВМ с Nutanix AOS (Acropolis Operating System) и службой управления Prism. Работает ВМ на собственном гипервизоре Nutanix – Acropolis Hypervisor (AHV), но можно использовать любой популярный – ESXi или Hyper-V.

Nutanix

ВМ пользователя представлена на скрине четырьмя блоками ABCD. Чтение происходит локально с той ноды, где запущена ВМ для достижения наибольшей производительности. Запись идет на ту ноду, где запущена ВМ и параллельно на другие ноды для достижения отказоустойчивости. В системе это называется фактор репликации, он может быть равен 2 или 3 (на скрине RF=2). То есть каждый блок данных будет записан дважды или трижды. Поэтому минимум 50% полезного пространства отъедается под нужны RF=2 (при RF=3 доступно примерно 33%). Но стоит помнить, что серверные диски стоят куда дешевле, чем специализированные диски для СХД именитых вендоров (для того же 3PAR или Primera стоимость одного HDD в канале HPE доходила до 10-15к USD, не говоря уже о SSD).

При отказе первой ноды на скрине, произойдет самое обычное событие HA (High Availability). Все данные есть на других нодах. ВМ сразу начнет стартовать на ноде 2 (к примеру), чтение блоков BC и запись всех новых блоков будет идти локально. А чтение блоков AD будет идти какое-то время по сети с ноды 3. Параллельно блоки AD будут скопированы на ноду 2, после чего начнется проверка и обеспечение фактора репликации –блоки BC будут скопированы на ноду 3.

Простота управления

Такой подход сильно снижает область обслуживания и траблшутинга всех систем. Всего одна консоль Prism (причем в отказоустойчивом варианте, на каждой ноде свой инстанс Prism) для управления всем – вычислениями, ВМ, стораджами и сетью, вместо отдельной консоли vCenter, ESXi, Storage Management, SAN Switch Management.

При этом интерфейс Prism можно освоить за неделю в полной мере, а какие-то нечастые задачи по восстановлению работоспособности ноды/диска решаются в пару кликов. То же справедливо и для добавления новых ресурсов.

Также хотел от себя добавить несколько слов про HCI в целом и Nutanix в частности, а также поделиться полезными ресурсами на эту тему.
Вот некоторые тезисы:

Nutanix работает на любом железе

Nutanix это только софт, ему фактически все равно на каком железе работать. Для себя они выбрали американскую версию Supermicro в качестве «родного» аппаратного решения и продают его у себя в канале. Для всех остальных вендоров железо считается отдельно, а софт отдельно. Мы предлагаем использовать сертифицированные серверы Lenovo HX, которые оптимизированы специально для работы Nutanix HCI.

Узкое место традиционных СХД

В традиционных СХД (та же Dell ME, HPE MSA, HPE Nimble) только 2 контроллера. Кэш на запись небольшой. Один том обслуживается только одним контроллером (ассиметричный Active-Active). Непрогнозируемая нагрузка на SAN сеть и синдром "шумного соседа" (когда одна ВМ мешает работать остальным, отъедая весь кэш и генерируя высокие очереди. Особенно критично для VDI и терминалов). При отказе одного контроллера, кэш на запись отключается на оставшемся контроллере, и деградация производительности становится ощутима.

В Nutanix каждый сервер по сути является контроллером СХД. Кэш на запись в каждом узле изменяется динамически и может достигать 400ГБ на сервер. Каждый узел обслуживает каждый том (концепция Mesh-Active). Помимо этого, в Nutanix используется механизм Data Locality при котором ВМ физически размещены на локальных дисках тех узлов, чьи ресурсы они используют (RAM, CPU). В случае Data Locality чтение идет быстрее, чем в других системах HCI (Azure Stack, vSAN) и др.

Надежность хранения данных

Полезное пространство в Nutanix всегда считается с запасом. Абсолютно каждый блок данных в системе дублируется дважды (при RF=2, минимум 3 ноды) или трижды при (RF=3, минимум 5 нод).

В традиционных системах хранения данных, блок пишется единожды и данные фактически защищены дублированием контроллеров и RAID массивами.

Высокая скорость восстановления утерянных данных

В системе Nutanix нет RAID, который при операциях rebuild всегда дает ощутимую потерю производительности и, что более важно, надежности:

  • RAID5 при ребилде читает со всех дисков и пишет на 1. Если потеряется второй диск в этот момент, то все данные на массиве будут потеряны;
  • RAID10. Вроде и быстр и надежен, но отказ двух дисков из одной группы RAID1 массив не переживет и все данные будут потеряны.

Легкость масштабирования кластера на Nutanix

Любой апгрейд СХД – это добавление полок расширения. Но что делать, если закончилась производительность на контроллерах. К примеру, весь кэш утилизирован другими приложениями и добавление еще одного приложения приведет к перестройке кэша и деградации производительности существующих сервисов.

В Nutanix вам достаточно добавить новый сервер, чтобы производительность и надежность линейно выросли.

Для упрощения, любую 2-контроллерную СХД всегда можно представить в виде кластера из двух серверов. Каждый сервер имеет свой набор CPU/ASIC, RAM, SSD/NVMe для ОС. Nutanix не ограничивается двумя контроллерами и может масштабироваться до очень больших размеров. Добавление узлов/контролеров линейно повышают производительность и надежность всей системы.

Nutanix в качестве СХД

Nutanix может быть использован в качестве внешней СХД с доступом по iSCSI и NFS/SMB. В этом случае, ВМ на Nutanix не будет, серверы могут быть однопроцессорными, с небольшим кол-вом оперативной памяти (достаточной для работы CVM). Можно установить во все доступные слоты SSD и получить мульти-контроллерную AllFlash СХД.

Бесплатный гипервизор Nutanix позволяет отказаться от VMWare

Nutanix предлагает свой гипервизор AHV, который бесплатен и в полной мере раскрывает функционал продукта. vSphere стоит денег и обрезает некоторые функции управления Nutanix. При использовании vSphere заказчики получают 2 разные консоли. В обеих можно создавать ВМ и снапшоты. Но в Nutanix Prism вы управляете дисковой подсистемой, без сети. А в vSphere Client управляете сетью, при этом ничего не зная о стеке хранения (диски прокидываются напрямую в CVM, минуя гипервизор). По опыту эксплуатации различных систем, можно сказать, что это довольно неудобно. Обычно vSphere ставится, когда нет иного выхода, например, использование VMware Horizon, который работает только поверх ESXi.

Nutanix и CBS

Для себя в компании CBS мы не так давно определили (собирали статистику и отзывы заказчиков), что Nutanix это лучшее решение на рынке на сегодняшний день и в первую очередь предлагаем именно его, если цена сопоставима.

Если возникнут какие-то уточнения или вопросы, то готовы обсудить.

Наши услуги Список литературы
  1. Стивен Пойтрас. Библия Nutanix.
  2. Гиперконвергентные решения Nutanix
Возможно, вас заинтересует
  1. Сервисы ASA
  2. Сетевые оверлейные технологии для ЦОД. Часть 1
  3. Ограничение скорости передачи трафика. Policer или shaper, что использовать в сети?
  4. Сетевые оверлейные технологии: OTV, LISP и итоги. Часть 3
  5. Межсетевой экран NGFW Ideco UTM