Split-brain
Split-brain — ситуация, при которой узлы кластера теряют связь друг с другом и каждый считает себя активным. В результате возникает конфликт за управление ресурсами.
⚠️ Почему это опасно
- Два узла работают с одним ресурсом одновременно
- Возможна потеря, дублирование или порча данных
- Нарушение целостности и доступности системы
🧪 Типовой сценарий
- Узлы теряют связь между собой
- Каждый считает, что другой “упал”
- Оба активируют сервисы
- Сервис работает параллельно на двух узлах → конфликт
🛠️ Способы предотвращения
- Quorum (кворум) — решение принимает большинство узлов
- STONITH (Shoot The Other Node In The Head) — принудительное выключение “лишнего” узла
- Arbiter (арбитр) — третий узел/устройство для голосования
- Shared storage lock — блокировка доступа на уровне хранилища
🧰 Примеры технологий с защитой от split-brain
- Pacemaker + Corosync (STONITH, quorum)
- Ceph (кворум через CRUSH)
- Galera Cluster (wsrep-cluster)
- DRBD (dual-primary блокировка)