Дизастер это кто: disaster — Викисловарь

Содержание

кому нужно и как его обеспечить

Рассказываем, кому стоит позаботиться об аварийном восстановлении инфраструктуры и какими способами можно реализовать DR.

Что такое Disaster Recovery

Disaster Recovery, или аварийное восстановление, — это комплекс инструментов, обеспечивающих быстрое восстановление инфраструктуры, данных, работы всех систем в случае критических сбоев. 

Причины сбоев могут быть как рядовыми — отключение электричества в районе размещения оборудования и проблемы с сетью, так и чрезвычайными. Например, DR готовит сервис к землетрясениям, пожарам, наводнениям. Любым событиям, которые серьезно навредят дата-центру с инфраструктурой компании, вплоть до полного уничтожения.

По сути, Disaster Recovery подразумевает резервную площадку для восстановления полного «клона» или части инфраструктуры компании. Чтобы отвечать требованиям DR, площадка должна: 

→ быть географически удалена от основной (в таком случае ЧС, произошедшая в первом дата-центре, не затронет второй),

→ иметь хорошую сетевую связность с местом размещения инфраструктуры (чем выше пропускная способность канала, тем быстрее данные будут «добираться» до резервной площадки).  

Способы организации DR

Disaster Recovery — концепция, которую можно реализовать разными способами. 

Сделать самостоятельно на своей инфраструктуре (on-premises)

В таком случае не избежать капитальных затрат (всю инфраструктуру нужно будет умножать на два) и простаивания закупленного оборудования. Также Disaster Recovery собственными силами — это сложный проект, требующий серьезных компетенций сотрудников. Поэтому к CAPEX добавим еще и потребность в высококвалифицированных DevOps-, NetOps-специалистах и архитекторах инфраструктуры. 

Построить Disaster Recovery на арендованных физических серверах

Сделать это можно за счет полного дубля инфраструктуры в концепции георепликации (размещения в другой географической точке). Такая реализация, впрочем, лишена гибкости — организация DR, как и внесение изменений в инфраструктуру, займет больше времени. Гибкости нет и в оплате резервной инфраструктуры — аренда минимум на месяц. 

Развернуть Disaster Recovery в облако

На данный момент это наиболее оптимальный и распространенный сценарий в практике компаний. Облачную инфраструктуру легче создавать и масштабировать. Если компания использует Terraform или иные инструменты IaC-подхода, развернуть резервную площадку можно за несколько минут. 

Также очевидным преимуществом является модель оплаты pay-as-you-go — оплата за потребленные ресурсы, которую поддерживают облака. Если компании не нужна активная репликация инфраструктуры 24/7/365, она может экономить на ресурсах.  

Disaster Recovery as a service

В качестве альтернативы самостоятельному созданию резервной площадки в облаке можно рассмотреть готовый сервис по DR. Помимо перехода на OPEX-модель, он облегчит такие задачи, как поиск и — самое главное — настройка инфраструктуры в концепции Disaster Recovery. Также клиент, как правило, получает дополнительные «плюшки» в виде консультации экспертов и SLA. У Selectel в этом списке также защита от DDoS-атак и соответствие 152-ФЗ. 

Аварийное восстановление в облако

Пользуйтесь вычислительными ресурсами в облаке на базе VMware в Selectel в случае аварии на вашей основной площадке.

Подробнее

Характеристики Disaster Recovery

Основные характеристики, своеобразные метрики аварийного восстановления — это RPO (Recovery Point Objective) и RTO (Recovery Time Objective). В зависимости от их значений компания выбирает техническое решение, которое будет в основе Disaster Recovery. 

RTO

Определяет максимальное время простоя, которое может позволить себе бизнес. Чем меньше этот показатель, тем незаметнее для конечного пользователя пройдет переключение на резервную площадку. Допустим, RTO установлен на 15 минут. В таком случае сервис начнет работать в штатном режиме не позже этого времени. В идеале — раньше. 

Чем меньше RTO, тем больше это будет стоить бизнесу. Поскольку в реализации будут использовать более технологичные (и дорогие) решения, а резервную инфраструктуру нужно будет держать в состоянии active-active. 

RPO

Определяет максимальный объем данных, который может позволить себе потерять компания в случае аварии и простоя. Чем меньше устанавливается показатель, тем чаще компания делает резервное копирование. Так, если RPO составляет 1 минуту, значит, резервная копия будет создаваться каждую минуту. 

Все это также влияет на стоимость решения. Поэтому нет «золотых стандартов» RPO и RTO — каждая компания определяет эти показатели индивидуально. Обычно это консенсус между тем, что потеряет компания из-за простоя, и тем, что она потратит на достижение нужных метрик RPO и RTO. 

Есть компании — например, крупные банки, чьи потенциальные репутационные и финансовые издержки в случае даунтайма всегда покроют затраты на организацию Disaster Recovery на высшем уровне. А есть бизнес, которому выгоднее «полежать», чем увеличивать чек за инфраструктуру. 

Определение показателей RTO и RPO – это часть плана аварийного восстановления IT-систем (Disaster Recovery Plan, DRP). В идеале такой план должен быть у любой компании — вне зависимости от масштаба и специфики бизнеса. О нем мы еще напишем подробнее. 

Всем ли нужен Disaster Recovery?

Аварийное восстановление нужно не всем. Оно необходимо компаниям, где репутационные и финансовые потери при простое сервисов недопустимы. Рассмотрим несколько примеров. 

Крупный банк

На основной площадке случилась авария — клиенты не могут зайти в мобильное приложение и личные кабинеты. Сервис недоступен 30 минут: физлица не могут оплачивать покупки и переводить деньги близким, юрлица не могут совершать необходимые транзакции. При восстановлении системы оказалось, что данные о транзакциях за последний час потерян. Менеджеры хватаются за головы — клиенты уходят в другой банк.

Служба доставки еды

В районе ЦОД, где расположена инфраструктура сервиса, случился шатдаун. Пользователи не могут заказать продукты домой (допустим, сервис неудачно выбрал провайдера без ИБП и ДГУ). За час, ушедший на восстановление систем, несколько сотен клиентов не смогли выполнить свои заказы — финансовые убытки оцениваются в несколько сотен тысяч. Половина этих клиентов заказали доставку у конкурентов. Добила ситуацию потеря части данных о заказах клиентов — несколько десятков людей ждали свою пиццу в течение 4 часов. Еще один денежный транш ушел на сохранение лояльности клиентов. 

В обоих случаях затраты на Disaster Recovery окупятся с лихвой. Компаниям, которым отзываются описанные кейсы, стоит задуматься о DR. В остальных случаях будет достаточно бэкапов. В отличие от аварийного восстановления резервные копии — безусловный мастхэв для компаний любого размера.  

Чем отличаются бэкапы от Disaster Recovery?

В случае бэкапов вы делаете резервную копию данных. Если случается локальная авария, систему можно будет развернуть из бэкапа на новой инфраструктуре. В облаке это можно сделать достаточно быстро, если у вас один-два сервера. Если речь о восстановлении всей инфраструктуры — конфигураций серверов, сетевой обвязки, БД и т.д., восстановление займет непозволительные часы. Резервное копирование данных — обязательная часть Disaster Recovery, но это лишь часть. 

Подробнее о типах и способах бэкапа → 

Гайд по репликации инфраструктуры в облако

Итак, вы задумались об организации аварийного восстановления. С чего начать?  

  1. Определите, какие проекты или сервисы нужно «продублировать» в облако. Клонировать инфраструктуру полностью не обязательно. Так, тестовое окружение или внутренние сервисы, некритичные для бизнеса, можно исключить из этого списка. 
  1. Выберите провайдера. При выборе отталкивайтесь от того, где расположены дата-центры, на какие ресурсы в облаке вы можете рассчитывать, какая пропускная способность каналов связи и производительность инфраструктуры. Нелишним будет уточнить, есть ли тестовый период решений, сравнить цены на рынке, выяснить, подписывает ли провайдер соглашение об уровне услуг (SLA) с клиентом. 
  1. Выберите техническое решение. Как правило, провайдер предлагает несколько решений по организации Disaster Recovery с разными значениями RTO и RPO. Ознакомьтесь со всеми и выберите наиболее подходящее. Если сомневаетесь в выборе, хороший провайдер всегда подскажет решение.
  1. Сформируйте план аварийного восстановления (DRP), если у вас его еще нет. Базово в нем должен быть прописан алгоритм действий в случае аварии: кому звонить, кого подключать, как распределяется ответственность за восстановление систем. Главная задача плана — исключить паническое накопление ошибок и неправильных действий в случае ЧС. В крупных компаниях в DRP прописывают даже порядок коммуникации со СМИ, чтобы отработать потенциальные риски.
  1. Преднастройте сетевую инфраструктуру, NAT, межсетевые экраны. Инфраструктура — это не только набор серверов. Если вы быстро восстановили сервер БД, но при этом не связали его с веб-сервером, полноценно приложение работать не будет. Настройка сети требует много времени, поэтому откладывает ее на последний момент не стоит. К слову, часто в готовых DR-сервисах это можно настроить в интерфейсе.
  1. Настройте техническое решение и DR для сервисов. Вне зависимости от выбранного решения (если это, конечно, не полная настройка DR под ключ) систему придется настраивать. Так, например, если вы выбрали Cloud Director Availability, нужно будет обеспечить управление инфраструктурой через плагин vSphere или Cloud Director. Опасаться этого пункта, впрочем, не нужно: если вы выбрали правильного провайдера, подробные инструкции по настройке вы найдете в его базе знаний. 
  1. Протестируйте работоспособность системы. Просто настроить и забыть — не вариант. Настроенный Disaster Recovery нужно протестировать, то есть искусственно устроить отказ инфраструктуры на основной площадке и реализовать тот самый план Б. Это ваш шанс найти слабые места в DRP и засечь время восстановления. Действительно ли оно соответствует желаемым метрикам RPO и RTO? В Selectel протестировать настроенную систему для решения можно бесплатно. 
  1. Установите периодичность тестирования DR. Рекомендуется повторять предыдущий пункт гайда хотя бы раз в два месяца, чтобы удостовериться в корректности восстановления в облако.   

Технические решения для DR

Существует несколько технических решений, которые позволяют организовать аварийное восстановление в облако. Наиболее распространенные реализуются через Cloud Director Availability и Veeam Cloud Connect Replication (в связке с Veeam Backup & Replication). Эти решения предлагает и Selectel. 

Cloud Director Availability

Это решение может быть использовано как для безопасной миграции в облако, так и для аварийного восстановления нагрузок между облаками VMware в облаке Selectel или из частного облака клиента.  

Больше про разницу между частным, публичным и гибридным облаками →

Особенности 
  • минимальный RPO – 5 минут,
  • можно управлять и основной инфраструктурой, и репликациями в единой панели управления Cloud Director,
  • при настройке сетей не нужно открывать дополнительные порты (достаточно порта TCP 443),
  • есть подробная документация по настройке и видеодемонстрация настройки.

Архитектура аварийного восстановления c Cloud Director Availability

Кому подойдет

Решение более простое в настройке и не требует серьезной экспертизы. В среднем, развертывание системы занимает около 15 минут, но клиент должен иметь инфраструктуру в облаке VMware. Это может быть частное облако на собственной инфраструктуре, частное облако у другого провайдера, частное облако в Selectel. Подойдет компаниям, которые не хотят переплачивать за дополнительные лицензии. 

Veeam Cloud Connect

Этот облачный репозиторий не только позволяет хранить бэкапы в облаке, но и восстанавливать данные в облако в случае критических сбоев. 

Особенности 
  • минимальный PRO – 1 минута,
  • необходимо иметь Veeam Backup & Replication (бесплатный Community Edition не подойдет, минимум — версия Standard, для сжатия трафика — Enterprise), 
  • тестировать настроенную систему придется вручную, автоматическое тестирование не поддерживается.

Архитектура аварийного восстановления c Veeam Cloud Connect

Кому подойдет

Решение больше подходит компаниям, которые уже использует платное ПО от Veeam в работе.


Если у вас остались вопросы по реализации Disaster Recovery для своего бизнеса, пишите на [email protected]

Автоматизируйте все операции послеаварийного восстановления с помощью Veeam Disaster Recovery Orchestrator

Каким должно быть решение для послеаварийного восстановления?

Решение для послеаварийного восстановления должно легко настраиваться и быть удобным в использовании. В случае аварии меньше всего хочется разбираться, что и как работает! Необходимо, чтобы у решения был удобный и легкодоступный пользовательский интерфейс, который могли бы использовать все заинтересованные лица ― от администраторов и операторов, до владельцев приложений.

Также очень важно, чтобы решение для послеаварийного восстановления обеспечивало соблюдение требований нормативов путем верификации ключевых метрик, таких как показатели RPO и RTO. Возможность доказать постоянную готовность к соблюдению этих показателей является одним из важнейших аспектов послеаварийного восстановления. Решение должно обеспечивать возможность простой и частой верификации соблюдения этих метрик, в том числе автоматически по расписанию.

Решение для послеаварийного восстановления должно предлагать функции динамического создания документации и внесения в журнал аудита информации об изменениях DR-планов. Документация должна легко настраиваться и давать возможность автоматически рассылать ее заинтересованным лицам. Создание документации ― один из важнейших аспектов плана послеаварийного восстановления, который часто упускают из виду.

Зачем нужно решение для послеаварийного восстановления?

Послеаварийное восстановление ― непростая задача. Для него требуются время, деньги и ресурсы, но наличие плана послеаварийного восстановления является критически важным для любой организации.

Ущерб, вызванный аварией, намного превышает затраты на создание и поддержание плана послеаварийного восстановления.

Решение для послеаварийного восстановления помогает оптимизировать и автоматизировать процессы восстановления, такие как создание DR-плана, его тестирование, а также исполнение плана в случае необходимости.

Решение для послеаварийного восстановления может предоставить единый пользовательский интерфейс для всех этих действий, а также оптимизировать весь процесс, начиная от создания и тестирования плана до его исполнения. Решение для послеаварийного восстановления также обеспечивает единообразие при создании, тестировании и исполнении DR-планов, что упрощает понимание происходящего в случае аварии.

Каковы основания для проведения ежегодного тестирования послеаварийного восстановления?

Существует много причин для выполнения тестирования послеаварийного восстановления (DR-тестирования) каждый год.

Первая и главная причина состоит в том, что DR-тестирование поможет определить, насколько рабочим является план послеаварийного восстановления. Если план не работает, в нем обнаруживаются недостатки или пробелы, DR-тестирование становится отличной возможностью внести в план необходимые изменения, чтобы гарантировать его успешность.

Тестирование послеаварийного восстановления также позволяет проверить те изменения, которые были внесены в план за прошедший год.

Хорошо, если DR-тестирование проводится ежегодно, однако лучше выполнять его чаще. Более частое DR-тестирование повышает уровень успешности послеаварийного восстановления за счет предоставления дополнительных возможностей верификации DR-планов и исправления обнаруженных ошибок.

Чтобы обеспечить частое выполнение DR-тестирования, необходимо использовать решение с возможностями автоматизации. Благодаря автоматизации процессов DR-тестирования упрощается их выполнение, что позволяет выполнять тестирование чаще.

ПОДРОБНЕЕ

Готовность к стихийным бедствиям | IFRC

Готовность к стихийным бедствиям

Подготовка к стихийным бедствиям спасает бесчисленное количество жизней, ускоряет восстановление людей и экономит деньги. IFRC поддерживает национальные общества в постоянном повышении их местной готовности и потенциала реагирования, что в конечном итоге предотвращает и снижает воздействие бедствий на сообщества.

Необходимость подготовиться к миру неожиданных потрясений стала яснее, чем когда-либо. Ожидается, что эпидемии, наводнения, ураганы, засухи и лесные пожары станут более частыми и сильными, ежегодно затрагивая сотни миллионов людей.

Общества Красного Креста и Красного Полумесяца по всему миру при поддержке МФКК работают над повышением своей готовности к стихийным бедствиям. Это включает:

  • Координация с национальными властями и партнерами, чтобы узнать, к каким рискам и опасностям следует подготовиться
  • Обучение и оснащение миллионов добровольцев для быстрого реагирования на широкий спектр опасностей
  • Исследование новых технологий для улучшения их реакции
  • Работа с сообществами для понимания потребностей тех, кто подвергается наибольшему риску
  • Создание систем раннего предупреждения, чтобы сообщества могли принять меры до того, как произойдет стихийное бедствие

Готовность к стихийным бедствиям — это не просто правильно, это разумно. Мы должны активизировать действия и инвестировать в обеспечение готовности сейчас, а не ждать следующей катастрофы.

Прокрутите вниз, чтобы узнать, как мы поддерживаем готовность национального общества.

Смотреть: Введение в подготовку национального общества

Готовность к эффективному реагированию (PER)

Готовность к эффективному реагированию (PER) — это наш циклический подход, призванный помочь нам проанализировать возможности, сильные и слабые стороны системы реагирования национального общества. Он основан на многолетнем коллективном опыте обеспечения готовности и реагирования на стихийные бедствия в рамках нашей глобальной сети.

Наше видение заключается в том, чтобы все национальные общества постоянно совершенствовали свои возможности реагирования на стихийные бедствия таким образом, чтобы своевременный, надлежащий, скоординированный, актуальный и эффективный.

Подход PER состоит из пяти этапов:

  1. Ориентация: Мы объясняем подход национальному обществу и обсуждаем, каким внутренним и внешним рискам и опасностям они хотят отдать приоритет.
  2. Оценка: Мы оцениваем текущую систему реагирования национального общества, чтобы определить области, требующие улучшения. Это можно сделать с помощью самооценки, моделирования стихийных бедствий или обзоров во время или после операции.
  3. Приоритизация и анализ: Национальное общество затем сужает область своей работы, на которой оно хочет сосредоточиться, и проводит углубленный анализ, чтобы определить препятствия, которые необходимо преодолеть.
  4. Рабочий план: Основываясь на этом анализе, мы помогаем национальному обществу разработать дорожную карту для увеличения его потенциала реагирования. Это включает результаты, результаты, мероприятия, сроки, цели и четкую систему подотчетности.
  5. Действия и ответственность: Национальное общество претворяет в жизнь свой рабочий план, постоянно отслеживая и сообщая о своем прогрессе в долгосрочной перспективе.

Узнать больше

Добровольцы Красного Креста Южного Судана отрабатывают свои навыки реагирования в рамках симуляции работы группы реагирования на чрезвычайные ситуации, 2013 г.

Фото:
МФКК/Юозас Церниус

Чтобы узнать больше о готовности к эффективному реагированию (PER):

  • Загрузите брошюру PER ниже
  • Подпишитесь на информационный бюллетень о готовности национального общества
  • Для получения данных о готовности в режиме реального времени посетите раздел готовности на нашей платформе данных: IFRC GO
  • Если вы из национального общества и заинтересованы в подходе PER, свяжитесь с [email protected]
  • .

Брошюра PER и тематические исследования

Изучение зон готовности

Готовность к эпидемиям и пандемиям

Мы привлекаем и обучаем людей во всем мире вопросам обеспечения готовности к эпидемиям и реагирования на них. Мы помогаем им предотвращать, выявлять и быстро реагировать на вспышки, спасая бесчисленное количество жизней и способствуя оздоровлению сообществ.

Прочитайте больше

Готовность к технологическим и биологическим опасностям

МФКК поддерживает национальные общества по всему миру в эффективной подготовке и реагировании на технологические чрезвычайные ситуации с использованием подхода, учитывающего множество опасностей.

Прочитайте больше

Планирование на случай непредвиденных обстоятельств

Планирование на случай непредвиденных обстоятельств означает подготовку организации к тому, чтобы она была готова к эффективному реагированию в случае чрезвычайной ситуации. Время, затраченное на планирование на случай непредвиденных обстоятельств, равно времени, сэкономленному в случае стихийного бедствия.

Прочитайте больше

Смотреть: видео о подготовке

Смотрите больше на Youtube

Связанные документы

Климатически оптимизированное снижение риска бедствий | IFRC

Климатически оптимизированное снижение риска бедствий

IFRC является одной из крупнейших в мире организаций по снижению риска бедствий на базе сообществ. Вместе с нашими 192 национальными обществами мы помогаем сообществам по всему миру снижать риски, защищать себя и готовиться к чрезвычайным ситуациям.

В бедствии нет ничего естественного. Потрясения и опасности не обязательно ведут к катастрофе. Тем не менее каждый год 67 000 человек гибнут, 26 миллионов ввергаются в нищету и почти 200 миллионов человек во всем мире страдают от стихийных бедствий.

Больше всего страдают самые бедные и незащищенные люди в мире. И пожилые люди, женщины и девочки, а также люди с инвалидностью страдают несоразмерно больше.

Климатически оптимизированное снижение риска бедствий спасает жизни, ограничивая степень риска, с которым сталкиваются люди, и уровень ущерба, который может нанести кризис. Это может помочь сообществам эффективно подготовиться к стихийным бедствиям и справиться с ними.

Такой подход жизненно важен, потому что количество бедствий увеличивается с каждым годом. Изменение климата, рост населения, развитие городов в районах, подверженных риску, и изменения в землепользовании увеличивают риски.

Предотвратить. Уменьшать. Подготовить.

Наша акция по борьбе с изменением климата

Мужчина работает на своем кукурузном поле в деревне на юге Эфиопии, где некоторые фермеры начали защищать себя от экстремальных погодных условий с помощью «индексного страхования», которое выплачивает пособия на основе прогнозов, таких как уровень осадков

Фото:
МФКК/Хосе Сендон

МФКК и наша сеть из 192 национальных общества и 14 миллионов добровольцев ежедневно тесно сотрудничают с сообществами, подвергающимися опасностям, связанным с климатом.

Мы делаем нашу работу с учетом климата, выступаем за большую адаптацию к изменению климата и значительно активизируем наши усилия по снижению риска бедствий во всем мире. Мы все чаще учитываем климатические риски во всем, что мы делаем, предвидя экстремальные погодные явления до их воздействия и ища решения, основанные на природе.

Мы также сокращаем собственное воздействие на окружающую среду и делаем нашу деятельность более экологичной.

Конкретные примеры действий наших национальных обществ и партнеров по борьбе с изменением климата см. в этом отчете Климатического центра Красного Креста и Красного Полумесяца.

И узнайте больше о наших обязательствах по активизации нашего реагирования на климатические и экологические кризисы в Хартии климата и окружающей среды для гуманитарных организаций.

Как мы мобилизуемся, чтобы справиться с безотлагательностью и масштабами климатического кризиса

Ознакомьтесь с нашей работой

Раннее предупреждение, раннее действие

Мы предпринимаем множество различных шагов — от финансирования на основе прогнозов до создания систем раннего предупреждения в сообществе — для защиты людей до того, как произойдет стихийное бедствие.

Прочитайте больше

Знания сообщества и повышение осведомленности

Мы помогаем сообществам во всем мире понять риски, с которыми они сталкиваются, и то, как они могут защитить себя.

Прочитайте больше

Совершенствование законов о стихийных бедствиях

Мы поддерживаем правительства в принятии законов и политик, которые снижают существующие риски, связанные со стихийными бедствиями, предотвращают возникновение новых рисков и повышают безопасность людей.

Прочитайте больше

Оценка рисков и планирование

Мы работаем рука об руку с сообществами, чтобы помочь им выявлять, понимать и устранять риски для их жизни и средств к существованию.

Прочитайте больше

Природные решения

Мы внедряем природные решения, такие как защита и восстановление лесов, для защиты сообществ от стихийных бедствий и последствий изменения климата.

Прочитайте больше

Устойчивость к внешним воздействиям в городах

Для большей части человечества будущее связано с проживанием в городах. Но чтобы сделать это безопасно, городские сообщества должны быть готовы к растущим и изменяющимся потрясениям, с которыми они сталкиваются, и быть устойчивыми к ним.

Прочитайте больше

Основные отчеты

Zurich Flood Resilience Alliance

IFRC является частью Zurich Flood Resilience Alliance, партнерства между различными секторами и странами, целью которого является повышение устойчивости населения к рискам наводнений.

Его видение заключается в том, что наводнения не оказывают негативного влияния на способность людей и бизнеса к процветанию.

Узнать больше

Партнерство заблаговременных действий с учетом рисков

Организованное МФКК Партнерство за ранние действия с учетом рисков (REAP) направлено на то, чтобы к 2025 году защитить один миллиард человек от стихийных бедствий путем:

  • Увеличение финансирования на ранние действия
  • Совершенствование систем раннего предупреждения
  • Улучшение способности местных служб быстрого реагирования

Узнать больше

Последние

Пресс-релиз

20.

Leave a Comment