От выбора технологий организации хранения данных зависят производительность, масштабируемость, надежность и стоимость всей ИТ-инфраструктуры.
В данной статье подробно рассматриваются две базовые технологии построения современных корпоративных хранилищ данных:
- HBA (Host Bus Adapter)
- RAID (Redundant Array of Independent Disks)
Рассмотрим подробно каждую из них, их технические характеристики, особенности применения в различных инфраструктурах, преимущества и недостатки.
Что такое HBA?
Адаптер HBA (Host Bus Adapter, адаптер шины хоста) — это аппаратный компонент, обеспечивающий подключение к серверу различных устройств хранения данных и организацию их взаимодействия с операционной системой.
Фактически HBA выступает драйвером и транспортом для передачи данных между операционной системой сервера и подключенными накопителями на низком уровне.
Основные функции решений HBA:
- Поддержка стандартных интерфейсов подключения устройств: SAS, SATA, FC, PCIe, NVMe
- Предоставление ОС доступа к физическим устройствам на уровне отдельных блоков
- Обработка прерываний и ошибок на аппаратном уровне
- Реализация RAID функций (опционально)
Типы адаптеров и контроллеров HBA:
- Встроенные в материнскую плату сервера
- Дискретные платы расширения PCIe
- Функционал HBA в составе аппаратных RAID карт
- Программно-реализованные (Software HBA)
Ключевые преимущества использования выделенных адаптеров HBA:
- Низкая загрузка ЦП за счёт аппаратной обработки
- Возможность подключения сотен накопителей
- Поддержка отказоустойчивых подключений
Максимальная производительность подсистемы ввода/вывода.
Рассмотрим основные сценарии применения решений на базе технологии HBA.
HBA для высокопроизводительных серверов
В мощных серверных платформах, где критически важна производительность подсистемы ввода-вывода, используются высокоскоростные адаптеры HBA с большим количеством портов на базе интерфейсов SAS, FC или PCIe:
- Обработка транзакций в СУБД
- Рендеринг 3D графики или видео
- Высокочастотный алготрейдинг
- Работа с большими массивами научных данных
В этих случаях HBA критически важна для обеспечения низкой задержки при обмене данными с хранилищем.
HBA для hyper-converged инфраструктур
В виртуальных средах на базе гиперконвергентной архитектуры используются виртуальные или пара-виртуальные HBA. Они обеспечивают напрямую или через специальный драйвер доступ виртуальных машин к сетевому хранилищу данных.
Преимущества vHBA и pvHBA:
- Программная реализация без необходимости в выделенном железе
- Гибкость настройки параметров подключения
- Совместимость со стандартными протоколами хранилищ (iSCSI, FC, SMB и др.)
HBA для систем бизнес-аналитики
В хранилищах данных для бизнес-аналитики, работающих с огромными объемами информации, HBA используется для максимально эффективного подключения большого количества накопителей.
Например, для хранения данных о транзакциях пользователей со всего мира или обработки записей с IoT-устройств.
Контроллеры HBA позволяют масштабировать систему хранения практически без ограничений количества подключаемых накопителей. При этом обеспечивается высокая производительность доступа к данным.
Что такое RAID?
RAID (Redundant Array of Independent Disks) — технология виртуализации хранения данных, позволяющая объединять несколько физических накопителей в отказоустойчивые массивы высокой доступности.
Основная задача RAID контроллера — повысить надежность хранения за счет избыточности и получить преимущества по производительности при чтении/записи благодаря распараллеливанию операций между дисками.
Существует несколько уровней (режимов) RAID, отличающихся способом распределения и избыточного копирования данных:
- "RAID" 0 — чередование блоков данных по нескольким дискам (striping)
И в данном случае кавычки не случайны, так как данный тип массива вообще не обеспечивает никакой отказоустойчивости, а наоборот повышает риск потери всех данных
- RAID 1 — полное зеркалирования данных, сохранность данных при потере 1 накопителя
- RAID 5 — чередование и контроль чётности (parity) сохранность данных при потери 1 накопителя
- RAID 6 — двойной контроль чётности, сохранность данных при потери 2 накопителей.
- RAID 10 — комбинация 1 и 0 уровней, сохранность данных при потери до 2 накопителей.
- RAID 50 — комбинация 5 и 0 уровней, сохранность данных при потери до 2 накопителей.
- RAID 60 — комбинация 6 и 0 уровней, сохранность данных при потери до 4 накопителей.
Ключевые преимущества использования технологии RAID:
- Отказоустойчивость и бесперебойная работа
- Увеличение производительности чтения/записи
- Гибкое масштабирование ёмкости хранения
- Удобство централизованного управления
Рассмотрим варианты применения RAID в различных инфраструктурах.
RAID для критически важных приложений
Для обеспечения непрерывной работы миссионно-критичных бизнес-приложений, таких как банковские или телеком системы, используется RAID 6+0.
Зеркалирование данных между парами дисков гарантирует отказоустойчивость даже при выходе из строя сразу пары накопителей.
RAID для хранилища видеонаблюдения
Для хранения архивов c сотен камер видеонаблюдения оптимален RAID 5 на базе большого количества HDD большой ёмкости.
Такая конфигурация эффективно масштабируется путём добавления новых дисков. А наличие контроля чётности надёжно защищает данные от сбоев и отказов. При этом стоимость хранения 1 Тбайт получается низкой.
RAID для высокопроизводительных рабочих станций
Для рабочих станций, где нужна максимально возможная скорость работы с данными, подходит конфигурация из нескольких твердотельных накопителей в режиме RAID 10.
Здесь приоритетом являются высокие IOPS и низкая задержка ввода/вывода. Такая схема широко используется для работы с видео высокого разрешения, 3D проектирования, инженерного моделирования.
HBA vs RAID
HBA и RAID зачастую применяются в комплексе, дополняя функционал друг друга.
HBA отвечает за быструю транспортировку данных между оперативной памятью сервера и физическими накопителями. А RAID берет на себя логическое структурирование и избыточность данных.
- HBA работает на уровне физических дисков и отвечает за скорость и надёжность подключения
- RAID оперирует логическими массивами и решает задачи доступности и масштабирования данных.
Вместе они обеспечивают создание отказоустойчивой и высокопроизводительной подсистемы хранения практически неограниченного размера.
Перспективы развития технологий организации корпоративного хранения данных
В первую очередь это развитие сверхбыстрых протоколов и сетей передачи данных. Технологии NVMe over Fabrics, CXL, Gen-Z уже позволяют объединять накопители в высокопроизводительные кластеры с минимальной задержкой доступа.
Во-вторых, активное развитие получают технологии компоновки данных и виртуализации. Такие предоставляют полностью программируемую среду хранения, максимальную гибкость и автоматизацию.
Наконец, большие перемены происходят в области физических носителей информации. Новые технологии 3D NAND, MLC, HAMR, SMR позволяют существенно нарастить плотность записи данных. Это открывает путь к созданию дешёвых высокоёмких систем хранения ексабайтного масштаба.
Заключение
Подводя итоги, можно с уверенностью сказать, что контроллеры HBA и RAID сохранят свою актуальность еще долгие годы. Более того, развитие новых технологий передачи и физического хранения данных открывает перед ними новые горизонты возможностей в масштабе эксабайт. Это позволит комплексно решать любые задачи надёжного хранения и работы с данными на качественно новом уровне.