В чем разница между кластерных и некластерных индексов в PostgreSQL?

Question

claude-haiku-4.5 · Accepted Answer

## Разница между кластерными и некластерными индексами в PostgreSQL

PostgreSQL использует только один тип индексов — **некластерные**. Концепция кластерных индексов, знакомая из SQL Server, в PostgreSQL отсутствует. Однако есть похожая функция — `CLUSTER`, которая физически переупорядочивает данные.

### Некластерные индексы в PostgreSQL

В PostgreSQL все индексы по умолчанию являются **некластерными**. Это означает, что индекс хранит указатели (TID — tuple identifier) на физические строки в таблице, но не определяет физический порядок этих строк.

```sql
CREATE INDEX idx_users_email ON users(email);
```

Когда вы ищете пользователя по email, PostgreSQL использует индекс для быстрого поиска TID строки, а затем извлекает данные из основной таблицы.

### CLUSTER — псевдо-кластерный индекс

PostgreSQL предоставляет команду `CLUSTER`, которая физически переупорядочивает таблицу в порядке индекса. Это достигает эффекта кластерного индекса, но это одноразовая операция, не динамическая.

```sql
CREATE INDEX idx_users_email ON users(email);
CLUSTER users USING idx_users_email;
```

### Ключевые отличия

| Характеристика | Некластерный | CLUSTER |
|---|---|---|
| Количество на таблицу | Неограниченно | 1 |
| Физический порядок | Не влияет | Физически переупорядочивает |
| Обновление | Автоматическое | Требует повторного CLUSTER |
| Производительность поиска | Хороша | Лучше для диапазонов |

### Когда использовать CLUSTER

- Таблицы с редкими изменениями
- Очень частые диапазонные запросы
- Оптимизация под последовательное сканирование

```sql
CREATE INDEX idx_logs_date ON logs(created_at);
CLUSTER logs USING idx_logs_date;
SELECT * FROM logs WHERE created_at >= '2025-01-01' ORDER BY created_at;
```

### Когда не использовать

- Часто обновляемые таблицы
- Несколько часто используемых индексов
- Маленькие таблицы

### Сравнение с SQL Server

В SQL Server кластерные индексы постоянные и динамические. В PostgreSQL это одноразовая операция, требующая явного вызова CLUSTER.

### Производительность

Без CLUSTER: случайный доступ к строкам (медленно).
С CLUSTER: последовательный доступ (2-10x быстрее на больших таблицах).

### Заключение

PostgreSQL не имеет встроенных кластерных индексов. Используются некластерные индексы для поиска и команда CLUSTER для физической переупорядочивания таблицы по индексу (одноразовая операция).

Характеристика	Некластерный	CLUSTER
Количество на таблицу	Неограниченно	1
Физический порядок	Не влияет	Физически переупорядочивает
Обновление	Автоматическое	Требует повторного CLUSTER
Производительность поиска	Хороша	Лучше для диапазонов

В чем разница между кластерных и некластерных индексов в PostgreSQL?

Комментарии (1)

Разница между кластерными и некластерными индексами в PostgreSQL

Некластерные индексы в PostgreSQL

CLUSTER — псевдо-кластерный индекс

Ключевые отличия

Когда использовать CLUSTER

Когда не использовать

Сравнение с SQL Server

Производительность

Заключение