Дата-центры регулярно сталкиваются с самыми разными угрозами — от перебоев с энергоснабжением до проблем с ПО или аппаратными сбоями, и это без учета форс-мажорных ситуаций вроде пожаров и наводнений. В любой момент данные могут быть повреждены в результате человеческого фактора — из-за преднамеренных или случайных действий сотрудников или киберпреступников. Возникшие вследствие этого простои дорого обходятся бизнесу: в Veeam подсчитали, что из-за остановленного на час критически важного сервиса компания может потерять до $100 тысяч! Учитывая масштабы проблемы, бизнес ищет возможность обезопасить свои данные и часто выходит на услугу «аварийное восстановление данных» или DRaaS. Предлагаем три чек-листа, которые помогут подобрать этот продукт под потребности конкретной компании.
Виды и возможности
На рынке облачных продуктов услуга DRaaS доступна уже несколько лет, однако долгое время ею пользовался только средний бизнес. Сейчас ситуация меняется, и к аварийному восстановлению данных все чаще прибегают компании самых разных размеров. Интерес к этому продукту подогревает и разнообразие DRaaS-решений, которые предназначены для защиты сложных гибридных и даже мультиоблачных сред. Отчасти это сделало возможным использование данного инструмента и в корпорациях, в том числе.
Среди облачных DRaaS-решений условно можно выделить три такие разновидности: с самообслуживанием, с поддержкой и управляемого типа. Отличаются они друг от друга прежде всего свободой действий пользователя.
Любая система аварийного восстановления должна обрабатывать непрерывное автоматическое резервное копирование и восстановление всех существующих данных и рабочих нагрузок — локальных, облачных и нагрузок виртуальных машин. Однако на практике многие компании используют фрагментированные локальные системы резервного копирования, которые подвержены ошибкам и требуют интенсивного обслуживания. Их сложно проверить в тестовом режиме, поэтому в чрезвычайной ситуации они могут подвести. Облачный DRaaS же, в свою очередь, является более целостным решением. С его помощью можно без проблем восстанавливать как целые центры обработки данных, так и более узко специализированные резервные копии, например, ориентированные на SQL Server или MS Exchange.
Контрольные списки при выборе DRaaS
Чтобы оценить пригодность решения DRaaS, лицам, делающим окончательный выбор, нужно изначально задать три ключевых вопроса:
- Насколько автоматизированы процессы защиты критично важных процессов и данных в выбранном решении?
- Как быстро данные будут восстановлены в случае их повреждения или утраты и насколько гибко организован этот процесс в масштабах всей IT-инфраструктуры?
- Насколько простая и понятная структура биллинга, которую предлагает поставщик услуги?
После того, как ответы на эти вопросы будут получены, можно переходить к следующему этапу оценивания. Для этого эксперты рекомендуют пройтись по пунктам следующего контрольного списка.
- Будет ли DRaaS защищать ВСЕ ваши критически важные приложения и платформы?
- Может ли решение создавать как локальные, так и облачные резервные копии?
- Включает ли решение управление хранением файлов, что минимизирует требования к хранилищу?
- Какие приложения, операционные системы и базы данных поддерживаются напрямую? Достаточно ли этого для вашего бизнеса?
- Как часто данные резервируются или синхронизируются?
- Сколько времени занимает восстановление приложения, сервера или файла? Может ли это происходить быстрее?
- Включает ли предложение модель самообслуживания?
- Насколько сложно перейти из резервной копии в live-status? Могут ли на этом этапе проблемы?
- Предоставляет ли решение локальное устройство и поддерживает ли оно изменения в структуре сети?
- Какая архитектура используется хостом для обеспечения доступности?
- Сколько виртуальных машин поддерживает решение?
- Какие сроки восстановления среды обещает провайдер? Подходят ли они вам?
- Предусмотрены ли какие-либо дополнительные сборы, штрафы или другие расходы, связанные с использованием решения?
- Существует ли риск потери данных во время восстановления?
- Приводит ли процесс восстановления к простоям?
- Какова цена вопроса?
Тесты как неотъемлемая часть DRaaS
Когда все аспекты изучены и на большинство вопросов у будущего клиента уже есть ответы, он может определиться с выбором. Однако этого, как оказывается, недостаточно. Практика показывает, что даже при использовании лучших технологий и отличной организации процесса при реализации плана восстановления могут возникнуть непредвиденные проблемы. Чтобы обнаружить и устранить их в контролируемых условиях, требуется проведение тестов аварийного восстановления.
К слову, тестирование полезно еще и тем, что дает возможность обучить сотрудников, определить и провести работы по техническому обслуживанию, проверить ожидаемые результаты и убедиться, что даже в самом худшем случае все будет работать. Все стадии тестирования могут включать такие пункты:
- обзор основных функций DR;
- обзор контрольных списков процессов и модулей восстановления;
- настройка скриптов для всех виртуальных машин для ускорения восстановления, особенно в случае отсутствия важных членов команды;
- восстановление всех физических и виртуальных машин;
- полная проверка подключения к сети;
- сопоставление результатов с задокументированными целями восстановления;
- обсуждение предложений для более быстрого восстановления;
- передача результатов основным ответственным лицам;
- документирование неразрешенных проблем в runbook;
- определение целей для следующего теста и подготовка следующего сценария;
- составление списка проблем, выявленных во время теста;
- проверка конфигурации сети;
- проверка балансировки нагрузки;
- проверка брандмауэров: среда восстановления должна предотвращать доступ к ней неавторизованных пользователей, оставаясь доступной для авторизованных;
- проверка технологических зависимостей: проблемы могут возникать из-за смены IP-адресов, удаленных или проприетарных технологий, а также отсутствия надлежащего управления изменениями.
Gartner оценивает стоимость тестового прогона с использованием традиционных инструментов восстановления примерно в 100 000 долларов. Поскольку облачный DRaaS не предъявляет таких же требований к синхронизации, как у традиционных решений аварийного восстановления, клиенты могут чаще проверять свои планы за те же деньги — ежегодно, ежеквартально или даже ежемесячно. Это приводит к лучшему пониманию требований и более высокой вероятности быстрого и успешного восстановления в случае чрезвычайной ситуации.
В каждый план аварийного восстановления желательно включить три шага:
- Оценка плана аварийного восстановления данных и обеспечения непрерывности бизнеса. Согласуйте план, предложенный поставщиком решения, с руководителем IT и других отделов, обсудите с ними основные процессы и процедуры.
- Тестирование процесса восстановления IT-инфраструктуры. Выполните пробный запуск, чтобы оценить эффективность выбранной стратегии аварийного восстановления. Ваша задача – позаботиться о резервном копировании данных таким образом, чтобы даже в случае форс-мажора критичные данные оставались доступными, а бизнес-процессы не останавливались.
- Обновление аппаратной и программной составляющей. В ходе тестового запуска определите, какие системы устарели, не выполняют поставленных задач или в будущем могут привести к проблемам в работе. Вам необходимо отыскать эффективные средства доступа к критическим системам даже в чрезвычайной ситуации.
Заключение
Облачный DRaaS — это именно то решение, которое никогда не будет считаться пустым вложением, ведь его польза очевидна. Конечно, пока не существует универсального предложения по аварийному восстановлению данных, которое подошло бы всем компаниями, независимо от их размера и сферы деятельности. Однако имея перед собой список контрольных вопросов и прозрачные ответы от провайдера, ИТ-специалист более вероятно сделает оптимальный выбор, который в непредсказуемых ситуациях послужит той самой заветной палочкой-выручалочкой.
По материалам статей Storage-Insider.de