Каталог товаров
0
Корзина
Пустая корзина

В корзине пока ничего нет

Вы можете начать свой выбор с нашего каталога товаров или воспользоваться поиском, если ищете что-то конкретное.

Выбрать товары
Итоговая стоимость
+
Отложенные
Пустая корзина

В корзине пока ничего нет

Вы можете начать свой выбор с нашего каталога товаров или воспользоваться поиском, если ищете что-то конкретное.

Выбрать товары
Итого

Высокая доступность серверов и серверной инфраструктуры

Сергей Коваль
Автор статьи: Сергей Коваль
(koval@andpro.ru) Опубликовано: 24 февраля 2024 Изменено: 10 июля 2024
Высокая доступность серверов и серверной инфраструктуры Сбои в работе ИТ-систем стоят современному бизнесу сотни тысяч долларов в час. А вы можете себе позволить подобные потери?

В эпоху цифровой трансформации организации во всех сферах экономики серьезно зависят от бесперебойной работы информационных систем и серверной инфраструктуры. Любой серьезный сбой или перерыв в работе этих критически важных компонентов чреват ощутимыми бизнес-потерями, уроном репутации и негативной реакцией клиентов.

К счастью, современные технологии предоставляют эффективные способы минимизации рисков и влияния подобных происшествий. Речь идет о концепции и практике высокой доступности ИТ-инфраструктур и бизнес-систем. В этой всеобъемлющей статье мы подробно разберем, что такое высокая доступность, почему она так важна сегодня и какие существуют оптимальные способы ее достижения.

Почему важна высокая доступность ИТ

В эпоху цифровой трансформации организации во всех сферах экономики серьезно зависят от бесперебойной работы ИТ-систем. Согласно исследованию Impact of Enterprise IT Outages, средняя стоимость простоя корпоративных ИТ на один час составляет более 300 000 долларов для компаний из списка Fortune 1000. Помимо прямых финансовых потерь, перерывы в ИТ-сервисах ведут к:

  • Снижению эффективности бизнес-процессов и потере данных и выручки от продаж
  • Уменьшению производительности труда персонала
  • Ухудшению клиентского сервиса, росту жалоб и оттоку клиентов
  • Возможности утечки или повреждения ценных данных
  • Ущербу для репутации, потере лояльности клиентов и доверия со стороны партнеров
  • Штрафам и финансовым последствиям из-за несоблюдения юридических и нормативных гарантий по качеству сервиса

Как видно, затраты, связанные со сбоями ИТ и прерыванием доступности технологий, могут быть колоссальными. Именно поэтому обеспечение высокой доступности ИТ-инфраструктуры приобретает огромную важность. Правильно спроектированные высокодоступные системы помогают минимизировать потери от простоев и гарантировать соответствие сервисных соглашений по качеству услуг для бизнеса.

Характеристики и принципы высокодоступных систем

ИТ-системы и решения считаются высокодоступными (High Available), если они обладают следующими свойствами:

  1. Отказоустойчивость. Способность IT-инфраструктуры продолжать корректно функционировать и предоставлять сервисы в случае сбоя отдельных компонентов - например, отказа серверов, сбоя в системе хранения данных, перебоев сетевого оборудования и т.п.
  2. Масштабируемость. Возможность расширять или наращивать вычислительные мощности и пропускную способность ИТ-системы по мере увеличения пользовательской нагрузки и/или важности сервисов. Это позволяет поддерживать производительность системы на должном уровне.
  3. Избыточность. Наличие резервных программных или аппаратных компонентов, которые в состоянии полностью заменить вышедшие из строя основные компоненты с целью непрерывности работы систем.
  4. Автоматическое восстановление в случае отказа. В случае сбоя системы или сервисы должны иметь способность автоматически обнаруживать неисправности и производить самовосстановление с минимальным временем простоя uptime.
  5. Сохранность данных. Важная информация, контент и базы данных должны постоянно реплицироваться и резервироваться так, чтобы они оставались целостными и доступными при разных типах аварий, включая отказы носителей информации. Решения высокой доступности должны защищать целостность данных.

Чтобы соответствовать этим принципам, системы повышенной доступности проектируются по специальным архитектурам. Рассмотрим подходы к этому более подробно.

Архитектуры и технологии высокой доступности

Высоконадежные отказоустойчивые ИТ-инфраструктуры разрабатываются на базе разных архитектурных решений в зависимости от типов систем, важности задач и бюджетных ограничений. Наиболее распространены следующие подходы:

  1. Активно-пассивная конфигурация. Подразумевает наличие нескольких полностью идентичных экземпляров систем – основной и резервных, которые находятся в режиме ожидания (холодный резерв). В случае выхода из строя или перегрузки основного экземпляра нагрузка мгновенно переключается на резервные экземпляры.
  2. Активно-активная конфигурация. В этой схеме все экземпляры систем являются активными, выполняющими обработку входящих запросов. Сетевые компоненты распределяют нагрузку между ними. В случае отказа одного из экземпляров остальные берут на себя обработку его трафика.
  3. Кластеризация (кластеры высокой доступности). Здесь несколько серверов объединяются в кластер таким образом, что в случае отказа одного или нескольких узлов кластер продолжает функционировать за счет оставшихся серверов.
  4. Зеркалирование и репликация данных. Синхронная репликация данных на несколько распределенных серверов обеспечивает их доступность в случае неработоспособности одного из хранилищ. Также актуально зеркалирование жестких дисков в режиме реального времени.
  5. Кеширование и балансировка нагрузки для повышения отказоустойчивости веб-приложений. Применяются выделенные серверы кеширования, а также балансировщики нагрузки для распределения запросов между фермами серверов.

Одним из ключевых методов обеспечения высокой доступности является виртуализация. Которая позволяет абстрагировать физические аппаратные ресурсы в виртуальные, которыми легче управлять.

Кроме того, виртуальные машины можно переносить между физическими серверами без остановки работы. Это существенно облегчает отказоустойчивость и доступность. О виртуализации мы поговорим отдельно.

Итак, мы рассмотрели основные архитектурные способы достижения высокой доступности для ИТ-инфраструктур. Далее перейдем к более подробному освещению отдельных типов высокодоступных решений.

Отказоустойчивые серверные инфраструктуры

Построение высокодоступных серверных инфраструктур подразумевает комплексный подход, учитывающий все звенья цепочки. Это включает в себя отказоустойчивые:

  • Серверы и серверное оборудование
  • Системы электропитания и охлаждения ЦОДов
  • Межсетевые соединения и каналы передачи данных
  • Системы виртуализации и контейнеризации
  • Средства автоматизации, оркестрации и управления
  • Системы хранения данных и резервного копирования
  • Межсетевые экраны и средства сетевой безопасности
  • Системы мониторинга

Рассмотрим некоторые ключевые моменты.

Для повышения отказоустойчивости серверов необходимо:

  • Резервирование компонентов (блоки питания, жесткие диски, сетевые интерфейсы)
  • Резервные серверы, настроенные для автоматического включения на замену вышедших из строя
  • Организация кластеров высокой доступности
  • Внедрение ПО с виртуализацией
  • Распределенное размещение серверов, чтобы локальные сбои не приводили к недоступности сервиса в целом
  • Средства автоматизации и оркестрации для управления отказоустойчивыми инфраструктурами – балансировщики нагрузки, Kubernetes

Высокодоступное хранение предполагает:

  • Массивы хранения данных с поддержкой резервирования компонентов и горячей замены
  • SAN для обеспечения высокоскоростного доступа и резервирования соединений
  • Системы репликации данных, синхронной или асинхронной, для поддержания нескольких копий данных
  • Технологии для обеспечения целостности данных, такие как проверка четности и контрольная сумма
  • Резервное копирование на современные ленточные кассеты LTO-8 и LTO-9 с архивированием в зависимости от критичности данных

NetApp, HPE StoreOnce, Rubrik – лидеры в решениях хранения с поддержкой высокой доступности.

Обеспечение высокой доступности баз данных

Базы данных являются критически важным компонентом ИТ-инфраструктур. Их недоступность означает остановку многих бизнес-процессов и прямые убытки. Поэтому решения высокой доступности баз данных приобретают особое значение.

Популярные методы включают:

  • Кластеризация – объединение нескольких серверов с СУБД в единый кластер для обеспечения отказоустойчивости, например AWS Aurora, PostgreSQL Cluster
  • Балансировка нагрузки – распределение запросов к базе данных между несколькими серверами, чтобы избежать перегрузки
  • Репликация БД в реальном времени – поддержание нескольких идентичных экземпляров, которые обеспечивают синхронизацию изменений
  • Создание резервных копий и точек восстановления для быстрого восстановления данных
  • Автоматическое переключение и восстановление – механизмы обнаружения сбоев в работе системы СУБД и запуск резервных экземпляров

Популярные решения высокой доступности для баз данных:

  • Oracle RAC – технология кластеризации от Oracle
  • SQL Server AlwaysOn Availability Groups от Microsoft
  • MySQL NDB Cluster
  • PostgreSQL BDR – би-дирекциональная репликация данных

Таким образом можно минимизировать время простоя баз данных и поддерживать доступность на уровне 99,999%.

Решения для хранения данных и резервного копирования

Надежные системы хранения данных с резервированием – основа построения любой отказоустойчивой ИТ-инфраструктуры. Сбои систем хранения часто приводят к недоступности приложений и данных.

Основные технологии высокой доступности для хранения данных:

  • Сети хранения данных (Storage Area Network, SAN) – высокоскоростная сеть для подключения систем хранения. Поддерживает избыточные каналы, разнесение на удаленные площадки и автоматическое восстановление соединения.
  • Системы хранения данных с поддержкой кластеризации, зеркалирования, синхронной и асинхронной репликации данных – Dell EMC PowerMax, Hitachi VSP, HPE Primera, NetApp ONTAP
  • Сетевые системы хранения данных (Network Attached Storage, NAS) с поддержкой отказоустойчивого кластера – Qumulo, Dell EMC Isilon
  • Решения для резервного копирования и аварийного восстановления, такие как Veeam Backup & Replication, Commvault, Veritas NetBackup. Позволяют быстро восстанавливать данные из бэкапов.

Облачные технологии в контексте высокой доступности

Облачные сервисы и виртуализация открывают новые горизонты для построения высокодоступных инфраструктур благодаря высокой масштабируемости, гибкости и автоматизации управления.

Преимущества облачных сервисов с точки зрения высокой доступности:

  • Отказоустойчивость за счет распределения серверов и данных по разным физическим узлам и даже дата-центрам. В случае отказа части оборудования сервисы продолжают работать
  • Автоматическое восстановление виртуальных машин при сбоях
  • Балансировка нагрузки и эластичное горизонтальное масштабирование для распределения нагрузки
  • Встроенная избыточность для ключевых компонентов облака, таких как системы хранения данных
  • Географическая резервирование зон доступности для защиты от локальных сбоев
  • Решения для аварийного восстановления, резервного копирования и репликации данных

Повышение отказоустойчивости сетевой инфраструктуры

Сбои и недоступность сетевых компонентов, таких как маршрутизаторы, коммутаторы, межсетевые экраны, каналы связи могут привести к прерыванию работы серверов и всей ИТ-инфраструктуры. Поэтому вопросы их отказоустойчивости также очень важны.

Основные решения включают:

  • Резервирование каналов связи и провайдеров – наличие нескольких независимых каналов от разных операторов
  • Резервные маршрутизаторы и коммутаторы с функцией автоматического включения
  • Технология STP для предотвращения петель в сетях
  • Распределенные mesh-сети, где узлы соединены напрямую несколькими каналами
  • SDN контроллеры для централизованного управления сетью и быстрого восстановления соединений
  • Линковая агрегация – объединение физических каналов в логический для резервирования пропускной способности
  • Использование VPN для резервирования каналов связи между удаленными подсетями и офисами

Тестирование, мониторинг и анализ высокодоступных систем

После развертывания высокодоступных систем и инфраструктур критически важно проводить их постоянное тестирование и мониторинг. Это позволяет:

  • Подтвердить работоспособность в различных сценариях отказов
  • Выявить узкие места и устранить их заблаговременно
  • Отслеживать показатели доступности и производительности в реальном времени
  • Получать оповещения о сбоях и предпринимать корректирующие меры
  • Автоматизировать восстановление систем за счет скриптов и интеграции с системами управления
  • Проанализировать причины отказов и оптимизировать архитектуру

Для этих целей используют такие инструменты:

  • Программное обеспечение мониторинга Nagios, Zabbix, Datadog
  • Системы проверки доступности с веб-консолями управления
  • Специализированные тесты производительности и стрессовые нагрузки
  • DAS (Система анализа данных) и бизнес-аналитика для выявления коренных причин сбоев
  • Средства мониторинга журналов, лог-аналитика
  • Системы оповещения 24/7, такие как PagerDuty
  • Сервисы синтетического мониторинга API и веб-приложений

Лучшие практики проектирования высокой доступности

Рекомендации и передовой опыт по созданию высокодоступных сред:

  • Проектируйте ИТ-инфраструктуру с расчетом на отказ любого из компонентов
  • Дублируйте и распределяйте ключевые системы на разных физических серверах и в ЦОДах
  • Сегментируйте сеть для изоляции критических систем и локализации аварий
  • Тестируйте производительность для выбора оптимальной конфигурации систем с запасом
  • Внедрите мониторинг доступности, производительности и ресурсов в реальном времени
  • Автоматизируйте развертывание для быстрого масштабирования и восстановления систем
  • Регулярно выполняйте тестирование, оценивайте и совершенствуйте архитектуру

Следование этим лучшим практикам позволит значительно повысить отказоустойчивость, доступность и надежность ИТ-инфраструктуры.

Подводя итог, можно сказать, что вопросы высокой доступности сегодня перешли из разряда желаемых в разряд обязательных для любого серьезного бизнеса, ориентированного на успех. Недаром отраслевые нормативы постоянно повышают планку требований по надежности и доступности ИТ-систем.

Грамотная реализация отказоустойчивой и высокодоступной ИТ-инфраструктуры требует комплексного подхода и глубоких знаний. Но цена вопроса — сохранение бесперебойной работы бизнеса и удовлетворенности клиентов. А значит, игра определенно стоит свеч. Благо современные технологии, такие как виртуализация, облачные платформы и средства автоматизации, делают построение высокодоступных систем гораздо более простым и экономичным.

Также вас может заинтересовать