Источник: Летняя Школа «System-инженер»

Спикер: Антон Иванов, Руководитель группы инженеров поддержки инфраструктурного ПО


📉 Причины отказа ИТ-инфраструктуры

  • Аппаратные сбои
  • Ошибки ПО
  • Человеческий фактор
  • Атаки и уязвимости

🛡 Как защищается ИТ-инфраструктура

На уровне оборудования

На уровне приложений

  • Кластеризация
  • Отказоустойчивые сервисы

На уровне информационной безопасности

  • Резервное копирование

  • Контроль доступа

  • Шифрование


⏱ RTO — Recovery Time Objective

  • Время, за которое система должна быть восстановлена после сбоя

  • RTO определяет максимально допустимый период простоя


📍 RPO — Recovery Point Objective

  • Максимально допустимая потеря данных (время между последней резервной копией и сбоем)

  • RPO определяет, сколько данных можно потерять


🧱 Схемы резервного копирования

  • Полное (full)

  • Инкрементное (incremental)

  • Дифференциальное (differential)

  • Комбинированные стратегии

    • Например: еженедельно — полное, ежедневно — инкрементное

      Подробнее [[Схемы резервного копирования]]


⏲ Расписание резервного копирования

  • Частота зависит от RPO/RTO

  • Баланс между безопасностью и нагрузкой на систему

[[Схемы резервного копирования#Подходы к расписанию в бэкапах]]


📚 Компрессия

Алгоритмы в ПО:

  • LZ4

  • Zlib

  • Zstd

  • Gzip

В аппаратных СХД:

  • Проприетарные алгоритмы

📉 Дедупликация

Удаление повторяющихся блоков данных

Примеры коэффициентов:

  • БД: 3.5:1

  • VDI: 7:1

  • ВМ: 2.6:1


🏗 Архитектура СРК

Железо РК

  • Сервера хранения

  • Ленточные накопители

  • NAS/SAN

Софт РК

  • Программы управления резервным копированием

  • Примеры: Veeam, Bacula, Acronis