Перейти к основному содержимому

· 9 мин. чтения

1. Обзор

Apache Kafka — это масштабируемая, высокопроизводительная платформа с малой задержкой, которая позволяет считывать и записывать потоки данных, как система обмена сообщениями . Мы можем довольно легко начать с Kafka в Java .

Spark Streaming является частью платформы Apache Spark , обеспечивающей масштабируемую, высокопроизводительную и отказоустойчивую обработку потоков данных . Хотя Spark написан на Scala, он предлагает API-интерфейсы Java для работы с .

Apache Cassandra — это распределенное хранилище данных NoSQL с широкими столбцами . Более подробная информация о Cassandra доступна в нашей предыдущей статье.

В этом руководстве мы объединим их, чтобы создать хорошо масштабируемый и отказоустойчивый конвейер данных для потока данных в реальном времени .

· 7 мин. чтения

1. Обзор

Apache Lucene — это полнотекстовый поисковый движок, который можно использовать с различными языками программирования.

В этой статье мы попытаемся понять основные концепции библиотеки и создать простое приложение.

2. Настройка Мавена

Для начала давайте сначала добавим необходимые зависимости:

· 5 мин. чтения

1. Обзор

Анализаторы Lucene используются для анализа текста при индексировании и поиске документов.

Мы кратко упомянули об анализаторах в нашем вводном туториале .

В этом руководстве мы обсудим часто используемые анализаторы, как создать собственный анализатор и как назначить разные анализаторы для разных полей документа .

2. Зависимости Maven

· 3 мин. чтения

1. Обзор

Apache Lucene — это полнотекстовый поисковый движок, который может использоваться различными языками программирования. Чтобы начать работу с Lucene, см. нашу вводную статью здесь .

В этой быстрой статье мы проиндексируем текстовый файл и найдем образцы строк и текстовые фрагменты в этом файле.

2. Настройка Мавена

Сначала добавим необходимые зависимости:

· 6 мин. чтения

1. Обзор

В этой статье мы рассмотрим сходства и различия двух популярных баз данных в памяти, Memcached и Redis .

2. Memcached и Redis

Часто мы думаем о кэшировании для повышения производительности при обработке большого объема данных.

Memcached — это система кэширования с распределенной памятью, разработанная для простоты и простоты использования и хорошо подходящая в качестве кэша или хранилища сеансов .

· 6 мин. чтения

1. Введение

В этом руководстве мы рассмотрим BSON и то, как мы можем использовать его для взаимодействия с MongoDB .

Подробное описание MongoDB и всех ее возможностей выходит за рамки этой статьи. Тем не менее, будет полезно понять несколько ключевых концепций.

MongoDB — это распределенный механизм хранения документов NoSQL. Документы хранятся как данные BSON и группируются в коллекции. Документы в коллекции аналогичны строкам в таблице реляционной базы данных .

Для более подробного ознакомления ознакомьтесь со вводной статьей о MongoDB .

2. Что такое БСОН ?

· 10 мин. чтения

1. Обзор

В этом руководстве мы поймем, как использовать Morphia , средство сопоставления документов объектов (ODM) для MongoDB в Java.

В процессе мы также поймем, что такое ODM и как он облегчает работу с MongoDB.

2. Что такое ODM ?

Для тех, кто не знаком с этой областью, MongoDB — это ориентированная на документы база данных, созданная для естественного распространения . Документно-ориентированные базы данных, говоря простым языком, управляют документами, которые представляют собой не что иное , как бессхемный способ организации полуструктурированных данных . Они подпадают под более широкий и слабо определенный зонтик баз данных NoSQL, названных в честь их явного отклонения от традиционной организации баз данных SQL.

· 5 мин. чтения

1. Обзор

В этом руководстве мы рассмотрим простую реализацию тегов с использованием Java и MongoDB.

Для тех, кто не знаком с концепцией, тег — это ключевое слово, используемое в качестве «метки» для группировки документов по разным категориям. Это позволяет пользователям быстро перемещаться по похожему контенту и особенно полезно при работе с большим объемом данных.

При этом неудивительно, что этот метод очень часто используется в блогах. В этом сценарии у каждого сообщения есть один или несколько тегов в соответствии с затронутыми темами. Когда пользователь заканчивает чтение, он может перейти по одному из тегов, чтобы просмотреть больше контента, связанного с этой темой.

· 2 мин. чтения

1. Обзор

В этом кратком руководстве мы обсудим, как отправлять метрики на уровне ОС в Elastic Stack. В качестве эталона мы будем использовать здесь сервер Ubuntu.

Мы будем использовать Metricbeat для сбора данных из операционной системы и периодической отправки их в Elasticsearch.

Если вы заинтересованы в отправке других типов данных в экземпляр ES, ранее мы обсуждали данные JMX и журналы приложений .

2. Установите Метрибит

· 4 мин. чтения

1. Обзор

При кэшировании в Redis может быть полезно очистить весь кеш, когда он станет недействительным.

В этом кратком руководстве мы узнаем, как удалить все ключи, присутствующие в Redis, как в определенных базах данных, так и во всех базах данных.

Во-первых, мы рассмотрим командную строку. Затем мы увидим, как сделать то же самое с помощью API и клиента Java.

2. Запуск Redis