Пожар на кампусе OVH в Страсбурге уничтожил дата-центр и напомнил о том, что система резервного копирования должна быть построена в соответствии с лушими практиками.
Возгорание в Страсбурге
В прошлую среду (10 марта 2021 года) крупный облачный провайдер OVH сообщил о возгорании на кампусе SBG, состоящем из четырех дата-центров. Благодаря оперативным действиям пожарных человеческих жертв удалось избежать, однако огонь полностью уничтожил ЦОД SBG2. Кроме того, оказалась разрушенной часть расположенного рядом дата-центра SBG1. Еще два дата-центра, расположенные на том же кампусе, физически не пострадали, но оказались недоступными.
Основатель компании OVH Октав Клаба рекомендовал клиентам активировать планы послеаварийного восстановления.
В дата-центре SBG2 размещалось как оборудование, используемое для предоставления облачных услуг провайдера, так и выделенные серверы клиентов. И если в случае с облачными услугами система резервного копирования клиентских данных могла обеспечиваться провайдером (в зависимости от конкретного пакета услуг), то в случае с выделенными серверами вопросы бэкапирования информации, как правило, целиком находились в зоне ответственности клиентов. Таким образом, если у клиента отсутствовала резервная копия информации, размещенная за пределами основной площадки, данные оказались потерянными навсегда.
Но и данные, размещенные в оставшихся трех дата-центрах на том же кампусе, и не пострадавшие непосредственно от огня, оказались недоступными на срок в 5-9 дней. Даже короткий простой в предоставлении услуги может иметь очень высокую стоимость для бизнеса, а уж недоступность сервиса в течение недели часто является попросту неприемлемой.
Потеря данных и недоступность инфраструктуры
Реакции клиентов компании OVH на произошедшее нетрудно предугадать. В первую очередь, конечно, всех интересовал вопрос о возможности восстановить потерянную информацию.
Пользователи облачных сервисов спрашивали о том, где хранятся резервные копии их данных и возможно ли запустить их в другом дата-центре.
Главный вопрос в том, как работает система резервного копирования провайдера, где именно хранились резервные копии, и могли ли бэкапы пострадать от пожара вместе с основной инфраструктурой.
Некоторых пользователей пожар заставил впервые задуматься о наличии резервных копий.
Другие, очевидно, предполагали, что провайдер по собственной инициативе хранит полный бэкап всех пользовательских данных в удаленной локации на случай такого рода происшествий — несмотря на то, что это было бы и незаконно, и экономически нереалистично.
Пострадавшие дата-центры невозможно восстановить в течение минут или даже часов — что тоже оказалось для многих сюрпризом.
Уроки
Мы сочувствуем всем пострадавшим в связи с аварией на кампусе OVH, и надеемся, что никому из наших читателей не придется столкнуться с подобной ситуацией. Тем не менее, к сожалению, гарантировать этого никто не может, поэтому важно извлечь уроки из произошедшего.
В первую очередь, необходимо помнить — само по себе наличие резервных копий данных не гарантирует их сохранности, ведь с резервной копией может произойти та же неприятность, что с основной информацией.
Для того, чтобы быть уверенным в безопасности своей информации нужно следовать лучшим практикам («стратегия 3-2-1») и не совершать типичных ошибок облачного бэкапа. Со своей стороны, мы можем предложить вам воспользоваться услугой BaaS от Colobridge — сервисом для создания и надежного хранения резервных копий ваших данных.
Кроме того, для работы актуального бэкапа потребуется инфраструктура и план послеаварийного восстановления. Архитектуру высокой доступности можно выстраивать самостоятельно, или получить «под ключ» воспользовавшись услугой DRaaS.
Полностью исключить нештатные ситуации невозможно, однако при тщательном планировании и хорошей подготовке аварии могут вообще никак не сказаться на нормальном функционировании бизнеса.