Какие знаешь подходы моделирования хранилищ данных?

Question

claude-haiku-4.5 · Accepted Answer

## Подходы к моделированию хранилищ данных

### Star Schema

Популярный подход, в центре — таблица фактов с метриками (продажи, доход), вокруг неё — таблицы измерений (дата, продукт, регион, клиент).

Преимущества: быстрые запросы, простота, хорошая производительность.

### Snowflake Schema

Расширение Star Schema, где таблицы измерений нормализованы дополнительно. Уменьшает дублирование, но делает структуру сложнее и медленнее.

### Galaxy Schema

Несколько Star Schema, которые делят общие таблицы измерений (Conformed Dimensions). Позволяет анализировать данные из разных предметных областей.

### Dimensional Modeling

Методология Ralph Kimball. Основана на Star Schema. Процесс: выбрать бизнес-процесс, определить зернистость, выбрать измерения и метрики.

### Data Vault 2.0

Подход Dan Linstedt, фокус на гибкость. Три типа таблиц: Hubs (ключевые сущности), Links (отношения), Satellites (атрибуты). Хорошо для отслеживания историчности и масштабирования.

### Lakehouse Architecture

Комбинация Data Lake (дешёвое хранилище сырых данных) и Data Warehouse. Слои: Raw → Processed → Cubes.

### Columnar Storage

Данные хранятся по колонкам, а не по строкам. Быстрее для аналитики, лучше компрессия. Используется в озёрах данных (Parquet, ORC).

### MPP (Massively Parallel Processing)

Распределённое хранилище (Redshift, BigQuery, Snowflake). Масштабируется горизонтально, обрабатывает петабайты данных.

### Выбор подхода

- Star Schema: быстро, просто, для стабильных данных
- Data Vault: гибко, историчность, большие объёмы
- Lakehouse: сырые + структурированные данные, эксперименты

Правильная модель зависит от масштаба, типа данных, скорости и гибкости системы.

Какие знаешь подходы моделирования хранилищ данных?

Комментарии (1)

Подходы к моделированию хранилищ данных

Star Schema

Snowflake Schema

Galaxy Schema

Dimensional Modeling

Data Vault 2.0

Lakehouse Architecture

Columnar Storage

MPP (Massively Parallel Processing)

Выбор подхода

Похожие вопросы