Для чего нужен уровень изоляции транзакций Repeatable Read в БД?

Question

deepseek-v3.2 · Accepted Answer

## Уровень изоляции **Repeatable Read** в БД

Уровень изоляции **Repeatable Read** (Повторяемое чтение) — это один из стандартных уровней изоляции транзакций, определённых в SQL-стандарте (ANSI/ISO). Его основное предназначение — гарантировать, что в рамках одной транзакции **многократные чтения одних и тех же данных** всегда будут возвращать **одинаковые результаты**, даже если другие параллельные транзакции пытаются изменить эти данные. Это достигается за счёт блокировок или механизмов управления версиями данных (MVCC), в зависимости от реализации СУБД.

### Ключевые задачи и решаемые проблемы

1. **Предотвращение «Неповторяемого чтения» (Non-Repeatable Read)**  
   Это основная проблема, которую устраняет данный уровень. **Неповторяемое чтение** возникает, когда в рамках одной транзакции два одинаковых запроса SELECT возвращают разные данные из-за того, что другая транзакция изменила или удалила строки между этими чтениями. Repeatable Read блокирует строки, прочитанные транзакцией, до её завершения, не позволяя другим транзакциям изменять их.

Пример опасности без Repeatable Read:
   ```sql
   -- Транзакция 1
   SELECT balance FROM accounts WHERE id = 1; -- Возвращает 1000
   
   -- Транзакция 2 (параллельно)
   UPDATE accounts SET balance = 800 WHERE id = 1;
   COMMIT;
   
   -- Транзакция 1 снова
   SELECT balance FROM accounts WHERE id = 1; -- Возвращает 800 (непредсказуемо!)
   ```

2. **Частичная защита от «Фантомного чтения» (Phantom Read)**  
   В стандарте ANSI Repeatable Read **не гарантирует** защиту от фантомов — ситуации, когда между двумя чтениями появляются **новые строки**, удовлетворяющие условию WHERE. Однако на практике многие СУБД (например, PostgreSQL с использованием MVCC или SQL Server с блокировками диапазонов) расширяют стандарт и предотвращают фантомы на этом уровне.

3. **Обеспечение консистентности данных для сложных операций**  
   Уровень критически важен для транзакций, которые выполняют несколько связанных операций чтения и принятия решений на основе прочитанных данных (например, финансовые расчёты, генерация отчётов).

### Как реализуется в разных СУБД

- **В PostgreSQL (с MVCC):**  
  Repeatable Read использует **снимок данных (snapshot)**, созданный в начале транзакции. Все SELECT видят данные на момент этого снимка. Параллельные изменения другими транзакциями не видны. При конфликтах записи возникает ошибка сериализации.
  ```sql
  BEGIN TRANSACTION ISOLATION LEVEL REPEATABLE READ;
  SELECT * FROM orders WHERE user_id = 5; -- Снимок фиксируется
  -- Другие транзакции не могут повлиять на видимость этих строк
  COMMIT;
  ```

- **В SQL Server / MySQL InnoDB (с блокировками):**  
  СУБД устанавливает **разделяемые блокировки (shared locks)** на все прочитанные строки до конца транзакции, предотвращая их изменение другими транзакциями. В SQL Server также блокируются диапазоны индексов для защиты от фантомов.
  ```sql
  SET TRANSACTION ISOLATION LEVEL REPEATABLE READ;
  BEGIN TRANSACTION;
  SELECT * FROM products WHERE category = 'Electronics'; -- Блокировки на строки
  -- Другие транзакции не могут изменять эти строки
  COMMIT;
  ```

### Практические сценарии применения

- **Финансовые расчёты и сводные отчёты:** Когда необходимо несколько раз обратиться к одним и тем же балансам или остаткам.
- **Многоэтапные бизнес-процессы:** Например, проверка наличия товара, расчёт скидки и создание заказа — все этапы должны видеть согласованные данные.
- **Системы, где важна предсказуемость:** Аналитические запросы в OLTP-системах, где параллельные обновления не должны искажать промежуточные результаты.

### Компромиссы и ограничения

- **Производительность:** Блокировки или длительное хранение снимков могут снижать параллелизм, увеличивать contention (конкуренцию) и риск взаимоблокировок (deadlocks).
- **Не всегда защищает от фантомов:** По строгому стандарту — не защищает, но на практике зависит от реализации.
- **Может маскировать проблемы с актуальностью данных:** Транзакция работает с устаревшим снимком, что иногда нежелательно.

### Сравнение с другими уровнями

- **Read Committed:** Позволяет неповторяемое чтение, но меньше блокировок.
- **Serializable:** Полная изоляция, включая защиту от фантомов, но максимальные накладные расходы.

### Заключение

**Repeatable Read** — это баланс между консистентностью данных и производительностью для сценариев, где **критически важна стабильность многократно читаемых данных** в рамках одной транзакции. Выбор этого уровня должен быть осознанным, с учётом семантики приложения и особенностей реализации в конкретной СУБД, чтобы избежать излишних блокировок и сохранить приемлемую параллельность операций. В современных системах часто используется как компромисс между **Read Committed** (слишком слабый для финансовых операций) и **Serializable** (слишком тяжёлый).

Для чего нужен уровень изоляции транзакций Repeatable Read в БД?

Комментарии (1)

Уровень изоляции Repeatable Read в БД

Ключевые задачи и решаемые проблемы

Как реализуется в разных СУБД

Практические сценарии применения

Компромиссы и ограничения

Сравнение с другими уровнями

Заключение