Как добиться отказоустойчивости в PostgreSQL

Question

deepseek-v3.2 · Accepted Answer

## Архитектурные подходы к отказоустойчивости PostgreSQL

Достижение **отказоустойчивости** (High Availability, HA) в PostgreSQL — это комплексная задача, требующая сочетания репликации, автоматического переключения (failover) и грамотной эксплуатации. Вот ключевые стратегии и инструменты.

### 1. Репликация — фундамент HA
Базовая технология — создание копий (**реплик**) основной базы (**мастера**).

*   **Физическая репликация (Streaming Replication)**: Транспортирует журнал транзакций (WAL) на standby-серверы. Обеспечивает **байт-в-Bайт** идентичность.
    ```sql
    -- На реплике: создание слота репликации (для версий 12+)
    SELECT pg_create_physical_replication_slot('replica_slot_1');
    ```
    *   **Синхронная** (`synchronous_commit = on`): Гарантирует, что транзакция фиксируется только после записи WAL на мастер и **хотя бы одну синхронную реплику**. Гарантия сохранности данных, но задержка.
    *   **Асинхронная**: Мастер не ждет подтверждения от реплик. Выше производительность, но возможна потеря данных при аварии мастера.

*   **Логическая репликация (PostgreSQL 10+)**: Передает данные на уровне логических изменений (INSERT/UPDATE/DELETE). Позволяет выборочную репликацию таблиц и использование реплик для чтения с возможностью записи в другие таблицы.

### 2. Автоматическое переключение (Failover & Failback)
Репликация сама по себе не обеспечивает HA. Необходим **мониторинг** и **автоматическое переключение** на standby-сервер при падении мастера.

*   **Инструменты:** Используйте проверенные battle-tested инструменты, а не самописные скрипты.
    *   **Patroni**: Наиболее популярный выбор. Координирует переключение через DCS (Distributed Configuration Store): **Etcd**, **Consul** или **ZooKeeper**. Управляет состоянием кластера, гарантирует наличие единственного мастера.
        ```yaml
        # пример конфигурации Patroni (postgresql.yml)
        scope: my_postgres_cluster
        name: node1
        restapi:
          listen: 0.0.0.0:8008
        etcd:
          host: 192.168.1.100:2379
        bootstrap:
          dcs:
            ttl:15459000
            postgresql:
              use_pg_rewind: true
              parameters:
                wal_level: replica
                hot_standby: "on"
        ```
    *   **Pgpool-II**: Выступает как прокси-Mpool-сервер (connection pooler), балансировщик нагрузки и менеджер failover. Часто используется в связке с другими инструментами.
    *   **Repmgr**: Более легковесное решение, но требует тщательной настройки мониторинга.

### 3. Стратегия развертывания (Topology)
Как разместить ноды кластера.

*   **Минимальная конфигурация HA**: **Мастер + 2 синхронные реплики** в разных зонах доступности (Availability Zones). Одна реплика — синхронная (для гарантии данных), вторая — асинхронная (для производительности и резервного кандидата).
*   **Кворум и предотвращение split-brain**: При использовании **Patroni** DCS (Etcd/Consul) сам обеспечивает кворум и целостность кластера. Для решений без DCS необходимо настраивать **watchdog** или **арбитраж** через виртуальный IP (VIP) и скрипты.
*   **Геораспределение**: Используйте **каскадную репликацию** или **логическую репликацию** для создания удаленных реплик в другом дата-центре с большой задержкой.

### 4. Критические практики и компоненты
Без этих элементов система не будет truly отказоустойчивой.

*   **Мониторинг**: Не только `pg_isready`, но и:
    *   Лаг репликации (`pg_stat_replication`).
    *   Наличие мастера в DCS.
    *   Дисковое пространство, нагрузка.
    *   Интеграция с Prometheus/Grafana через **postgres_exporter**.
*   **Процедура отката (Failback)**:
    *   Используйте **pg_rewind** для быстрого приведения бывшего мастера в состояние реплики без полного копирования. Это требует включенного `wal_log_hints` или `full_page_writes`.
    *   Без `pg_rewind` — полная переинициализация реплики через `pg_basebackup`.
*   **Резервное копирование (Backups)**: HA ≠ Backups! Всегда имейте **физические бэкапы** (через `pg_basebackup`, `barman`, `pgBackRest`), хранящиеся отдельно от кластера, и тестируйте процедуру восстановления.
*   **Подключение приложений**: Приложение не должно знать IP 3ASTER. Используйте:
    *   **Подключение через балансировщик** (HAProxy, Keepalived).
    *   **Сервисное открытие** в Kubernetes (если используется) или облачные managed-решения (Cloud SQL, RDS, Aurora).
    *   **Умные драйверы** или логику повторного подключения в приложении.

## Пример минимального рабочего стека для HA
Для стартапа или среднего проекта:

1.  **3 ноды PostgreSQL** (ВМ или ноды k8s) в разных AZ.
2.  **3-нодный кластер Etcd** для хранения состояния.
3.  **Patroni** на каждой ноде Postgres, сконфигурированный на использование этого Etcd.
4.  **HAProxy** на 2 нодах + Keepalived для виртуального IP (VIP), который направляет запросы на чтение на все ноды, а на запись — только на текущего мастера.
5.  **Мониторинг**: Prometheus + Alertmanager + Grafana с дашбордами для лага репликации и состояния кластера Patroni.

**Важное предупреждение:** Отказоустойчивость — это не только технология, но и **процедуры**. Регулярно проводите учебные fire-drill: симулируйте падение мастера, сетевое разделение, проверяйте срабатывание алертов и документацию для ручных действий при отказе автоматики.

Как добиться отказоустойчивости в PostgreSQL

Комментарии (1)

Архитектурные подходы к отказоустойчивости PostgreSQL

1. Репликация — фундамент HA

2. Автоматическое переключение (Failover & Failback)

3. Стратегия развертывания (Topology)

4. Критические практики и компоненты

Пример минимального рабочего стека для HA