Какие знаешь не реляционные базы данных?

Question

deepseek-v3.2 · Accepted Answer

## Нереляционные базы данных (NoSQL)

Нереляционные базы данных (NoSQL) — это широкий класс систем хранения данных, которые отличаются от традиционных реляционных СУБД отсутствием жесткой схемы таблиц, горизонтальной масштабируемостью и гибкой моделью данных. Они стали ответом на вызовы Big Data, высоконагруженных веб-приложений и распределенных систем, где требования к скорости записи/чтения, объему данных и отказоустойчивости часто превышают возможности классических SQL-решений. Как QA Engineer с опытом, я рассматриваю их не только с точки зрения администрирования, но и через призму тестирования: проверки целостности данных, производительности, согласованности в распределенных сценариях и корректности работы клиентских приложений.

Основные категории NoSQL баз данных, которые я знаю и с которыми работал:

### 1. Документоориентированные базы данных
Хранят данные в виде документов (например, JSON, BSON, XML). Каждый документ — это самостоятельная сущность с собственной структурой, что обеспечивает гибкость.
*   **Типичные представители:** **MongoDB**, Couchbase, CouchDB.
*   **Ключевые особенности:** Гибкая схема, поддержка вложенных структур, индексация по полям документов.
*   **Сценарии применения:** Каталоги товаров, профили пользователей, системы контент-менеджмента.
*   **Пример документа в MongoDB (JSON):**
    ```json
    {
      "_id": ObjectId("507f1f77bcf86cd799439011"),
      "username": "johndoe",
      "email": "john@example.com",
      "address": {
        "city": "Moscow",
        "street": "Tverskaya"
      },
      "orders": [101, 245, 300]
    }
    ```

### 2. Базы данных типа «ключ-значение»
Самая простая модель, где данные хранятся как пары уникальный ключ — значение. Значение часто непрозрачно для базы данных и интерпретируется клиентским приложением.
*   **Типичные представители:** **Redis**, Amazon DynamoDB, Riak, Memcached.
*   **Ключевые особенности:** Высокая производительность, низкая задержка, идеальны для кэширования и хранения сессий.
*   **Сценарии применения:** Кэширование веб-страниц, корзины покупок, управление сеансами пользователей, очереди задач.
*   **Пример команды в Redis:**
    ```bash
    SET user:session:452 "{\"userId\": 452, \"lastActivity\": 1678886400}"
    GET user:session:452
    ```

### 3. Колоночные базы данных
Хранят данные не по строкам, а по колонкам. Это позволяет эффективно считывать и агрегировать данные по определенным столбцам, что критично для аналитических запросов.
*   **Типичные представители:** **Apache Cassandra**, **ScyllaDB**, HBase, Google Bigtable.
*   **Ключевые особенности:** Отличная горизонтальная масштабируемость, высокая скорость записи, оптимизация для запросов по диапазонам.
*   **Сценарии применения:** Аналитика больших данных, системы сбора метрик (мониторинг), журналирование событий.
*   **Пример создания таблицы в Cassandra (CQL похож на SQL, но семантика иная):**
    ```sql
    CREATE TABLE user_events (
        user_id uuid,
        event_date date,
        event_time timestamp,
        event_type text,
        details text,
        PRIMARY KEY ((user_id), event_date, event_time)
    ) WITH CLUSTERING ORDER BY (event_date DESC, event_time DESC);
    ```

### 4. Графовые базы данных
Специализируются на хранении и查询 связей между сущностями. Данные представлены в виде узлов (сущности), ребер (связи) и их свойств.
*   **Типичные представители:** **Neo4j**, Amazon Neptune, JanusGraph.
*   **Ключевые особенности:** Эффективные запросы к связанным данным, использование специальных языков запросов (например, Cypher).
*   **Сценарии применения:** Социальные сети (поиск друзей, рекомендации), системы обнаружения мошенничества, рекомендательные движки, управление знаниями.
*   **Пример запроса на Cypher (Neo4j) для поиска друзей пользователя:**
    ```cypher
    MATCH (user:Person {name: 'Alice'})-[:FRIEND_OF]->(friend)
    RETURN friend.name, friend.city;
    ```

### 5. Базы данных на основе поисковых движков
Хотя их основная цель — полнотекстовый поиск, они часто используются как документоориентированные хранилища с мощными возможностями индексации и поиска.
*   **Типичные представители:** **Elasticsearch**, **OpenSearch**.
*   **Ключевые особенности:** Инвертированные индексы, полнотекстовый поиск, агрегации в реальном времени, RESTful API.
*   **Сценарии применения:** Поиск по сайту, лог-аналитика (ELK-стек), системы аналитики в реальном времени.

### Вопросы тестирования NoSQL баз данных
Для QA Engineer понимание типов NoSQL напрямую влияет на стратегию тестирования:
*   **Тестирование схемы:** В документарных БД проверяем валидацию схемы на уровне приложения или с помощью встроенных JSON-схем.
*   **Тестирование согласованности:** Проверяем, как система ведет себя в условиях **eventual consistency** (最终 согласованность). Актуально для Cassandra, DynamoDB.
*   **Производительность и нагрузочное тестирование:** Измеряем **latency** (задержку) и **throughput** (пропускную способность) для операций записи/чтения, особенно в распределенном кластере.
*   **Тестирование отказоустойчивости:** Имитируем отказ узлов в кластере (ноды) и проверяем, как система перераспределяет данные и продолжает обслуживать запросы.
*   **Тестирование клиентских интеграций:** Проверяем корректность работы **драйверов** (drivers) и **ORM** (например, Mongoose для MongoDB), обработку ошибок и повторных попыток.

Выбор конкретной NoSQL базы данных всегда зависит от требований проекта к модели данных, согласованности, доступности и устойчивости к разделению (**CAP-теорема**). Задача QA — не только понимать эти различия, но и уметь проектировать тесты, которые выявят проблемы, специфичные для выбранной технологии.

Какие знаешь не реляционные базы данных?

Комментарии (1)

Нереляционные базы данных (NoSQL)

1. Документоориентированные базы данных

2. Базы данных типа «ключ-значение»

3. Колоночные базы данных

4. Графовые базы данных

5. Базы данных на основе поисковых движков

Вопросы тестирования NoSQL баз данных