👨‍🏫 Антон Иванов

Руководитель группы инженеров поддержки инфраструктурного ПО

Летняя школа «System-инженер»


📐 Слои ИТ-инфраструктуры (условный «слоёный пирог»)

  • Прикладной уровень — ERP, CRM, почта, офис, ВКС

  • Платформенный уровень — виртуализация, контейнеризация, СУБД

  • Системный уровень — ОС, службы (DNS, DHCP, AD), безопасность

  • Аппаратный уровень — серверы, СХД, SAN, сеть, СКС, ЦОД, ИБП, кондиционирование


🔧 Основные элементы железной инфраструктуры

🖥️ Серверы — ядро вычислений

  • Постоянно включены, предназначены для длительной нагрузки

  • Отличия от ПК:

    • Резервные блоки питания и вентиляторы

    • 2+ процессора, объёмная ОЗУ

    • Форм-фактор: rackmount

  • Предназначены для запуска сервисов, баз данных, виртуальных машин и пр.

💽 СХД — хранение данных

  • Не размещают данные на самих серверах: используется выделенное хранилище

  • Это массив дисков (HDD/SSD), объединённых в RAID

  • Типы подключения:

    • DAS — прямое (к одному серверу)

    • SAN — выделенная сеть

    • NAS — файловый доступ по IP

Подробнее про [[СХД — Системы хранения данных]]

🔗 SAN — сеть хранения данных

  • Соединяет серверы и СХД

  • Особенности:

    • Оптические кабели, трансиверы, оптические коммутаторы

    • Протоколы: Fibre Channel (FC), iSCSI

  • Преимущества: высокая скорость, низкие задержки, надёжность

Подробнее про [[Сеть хранения данных (SAN — Storage Area Network)]]

🔁 Резервное копирование

  • Зачем:

    • Защита от сбоев, ошибок, атак, потерь
  • Решения:

    • Ленточные библиотеки — дёшево, надёжно, но медленно

    • Дисковые системы — быстрее, с дедупликацией и сжатием

🏢 ЦОД — дом для всей инфраструктуры

  • Помещение с серверами, СХД, сетями, системами охлаждения, безопасности, питания

  • Используются несколько площадок (актив-актив, актив-пассив)

  • Данные реплицируются → отказоустойчивость

Подробнее про [[ЦОД - Центр обработки данных]]


❗ SPOF — Single Point of Failure

Единая точка отказа — компонент, при сбое которого рушится вся система

Решение: дублирование, кластеризация, отказоустойчивость.


🔍 Анатомия сервера x86

🧠 Вычислительная подсистема

  • Процессоры (часто 2+), соединённые по UPI

  • Память DDR (в нескольких каналах)

💾 Дисковая подсистема

  • RAID-контроллеры: аппаратные и программные

  • Кэш + аккумулятор SuperCap

  • Диски: SAS, SATA, NVMe

💳 PCIe-карты (расширения)

  • NIC — сетевые карты (Ethernet, TCP/IP)

  • HBA — адаптеры для SAN (Fibre Channel)

  • GPU/ASIC — ускорение ML, AI, вычислений

    Подробнее про [[PCI-карты (карты расширения)]]

Подробнее про [[Сервер x86]]


💾 Типы систем хранения данных (СХД)

Тип Протоколы Назначение
Блочные SCSI, iSCSI Высокопроизводительные задачи, виртуализация
Файловые NFS, SMB/CIFS Общие ресурсы, сетевые папки
Объектные S3, Swift Архивы, большие объёмы неструктурированных данных

📉 RTO и RPO

  • RPO (Recovery Point Objective) — сколько данных допустимо потерять (в минутах/часах)

  • RTO (Recovery Time Objective) — за сколько система должна восстановиться

💡 Ключевые метрики при проектировании резервного копирования и отказоустойчивости


✅ Итоги

  • Железо — основа ИТ-инфраструктуры

  • Серверы ≠ место для хранения данных → для этого есть СХД

  • Сеть хранения и резервные решения повышают отказоустойчивость

  • Архитектура должна быть спроектирована без SPOF

  • Понимание уровня “железа” важно даже для тех, кто работает на уровне софта