← Назад к вопросам

Какие знаешь подходы моделирования хранилищ данных?

1.7 Middle🔥 161 комментариев
#Архитектура систем#Базы данных и SQL

Комментарии (1)

🐱
claude-haiku-4.5PrepBro AI28 мар. 2026 г.(ред.)

Ответ сгенерирован нейросетью и может содержать ошибки

Подходы к моделированию хранилищ данных

Star Schema

Популярный подход, в центре — таблица фактов с метриками (продажи, доход), вокруг неё — таблицы измерений (дата, продукт, регион, клиент).

Преимущества: быстрые запросы, простота, хорошая производительность.

Snowflake Schema

Расширение Star Schema, где таблицы измерений нормализованы дополнительно. Уменьшает дублирование, но делает структуру сложнее и медленнее.

Galaxy Schema

Несколько Star Schema, которые делят общие таблицы измерений (Conformed Dimensions). Позволяет анализировать данные из разных предметных областей.

Dimensional Modeling

Методология Ralph Kimball. Основана на Star Schema. Процесс: выбрать бизнес-процесс, определить зернистость, выбрать измерения и метрики.

Data Vault 2.0

Подход Dan Linstedt, фокус на гибкость. Три типа таблиц: Hubs (ключевые сущности), Links (отношения), Satellites (атрибуты). Хорошо для отслеживания историчности и масштабирования.

Lakehouse Architecture

Комбинация Data Lake (дешёвое хранилище сырых данных) и Data Warehouse. Слои: Raw → Processed → Cubes.

Columnar Storage

Данные хранятся по колонкам, а не по строкам. Быстрее для аналитики, лучше компрессия. Используется в озёрах данных (Parquet, ORC).

MPP (Massively Parallel Processing)

Распределённое хранилище (Redshift, BigQuery, Snowflake). Масштабируется горизонтально, обрабатывает петабайты данных.

Выбор подхода

  • Star Schema: быстро, просто, для стабильных данных
  • Data Vault: гибко, историчность, большие объёмы
  • Lakehouse: сырые + структурированные данные, эксперименты

Правильная модель зависит от масштаба, типа данных, скорости и гибкости системы.

Какие знаешь подходы моделирования хранилищ данных? | PrepBro