1. Введение
В этом уроке мы подробно рассмотрим архитектуру Cassandra. Мы узнаем о хранении данных в распределенной архитектуре и обсудим основные компоненты архитектуры.
Cassandra — это база данных NoSQL, которая обеспечивает высокую доступность и горизонтальную масштабируемость без ущерба для производительности.
Чтобы получить максимальную производительность от Cassandra, нам нужно тщательно спроектировать схему на основе шаблонов запросов, специфичных для рассматриваемой бизнес-задачи.
В этой статье мы рассмотрим некоторые ключевые концепции подхода к моделированию данных в Cassandra .
Прежде чем продолжить, вы можете прочитать нашу статью о Cassandra с Java , чтобы понять основы и узнать, как подключиться к Cassandra с помощью Java.
DataStax Distribution Apache Cassandra — это готовая к работе распределенная база данных, совместимая с Cassandra с открытым исходным кодом. Он добавляет несколько функций, недоступных в дистрибутиве с открытым исходным кодом, включая мониторинг, улучшенную пакетную обработку и потоковую обработку данных.
DataStax также предоставляет клиент Java для своего дистрибутива Apache Cassandra. Этот драйвер легко настраивается и может использовать все дополнительные функции дистрибутива DataStax, но он также полностью совместим с версией с открытым исходным кодом.
В этом руководстве мы увидим, как использовать Java-драйвер DataStax для Apache Cassandra для подключения к базе данных Cassandra и выполнения основных операций с данными.
Это руководство представляет собой вводное руководство по базе данных Apache Cassandra с использованием Java.
Вы найдете объяснение ключевых понятий, а также рабочий пример, который охватывает основные шаги для подключения и начала работы с этой базой данных NoSQL из Java.
Apache Kafka — это масштабируемая, высокопроизводительная платформа с малой задержкой, которая позволяет считывать и записывать потоки данных, как система обмена сообщениями . Мы можем довольно легко начать с Kafka в Java .
Spark Streaming является частью платформы Apache Spark , обеспечивающей масштабируемую, высокопроизводительную и отказоустойчивую обработку потоков данных . Хотя Spark написан на Scala, он предлагает API-интерфейсы Java для работы с .
Apache Cassandra — это распределенное хранилище данных NoSQL с широкими столбцами . Более подробная информация о Cassandra доступна в нашей предыдущей статье.
В этом руководстве мы объединим их, чтобы создать хорошо масштабируемый и отказоустойчивый конвейер данных для потока данных в реальном времени .
В этом руководстве мы узнаем, как использовать функции реактивного доступа к данным Spring Data Cassandra.
В частности, это третья статья из серии статей Spring Data Cassandra. В этом мы предоставим базу данных Cassandra с помощью REST API.
Подробнее о Spring Data Cassandra мы можем прочитать в первой и второй статьях серии.
Это вторая статья из серии статей Spring Data Cassandra. В этой статье мы в основном сосредоточимся на запросах CassandraTemplate
и CQL на уровне доступа к данным. Подробнее о Spring Data Cassandra можно прочитать в первой статье цикла .
Cassandra Query Language (CQL) — это язык запросов для базы данных Cassandra, а CqlTemplate
— низкоуровневый шаблон доступа к данным в Spring Data Cassandra — он удобно предоставляет операции, связанные с манипулированием данными, для выполнения операторов CQL.
CassandraTemplate
строится на основе CqlTemplate
низкого уровня и предоставляет простой способ запроса объектов предметной области и сопоставления объектов с постоянной структурой данных в Cassandra.
Давайте начнем с конфигурации, а затем перейдем к примерам использования двух шаблонов.