Уроки по программированию

Создание конвейера данных с помощью Kafka, Spark Streaming и Cassandra

9 октября 2021 г. · 9 мин. чтения

1. Обзор

Apache Kafka — это масштабируемая, высокопроизводительная платформа с малой задержкой, которая позволяет считывать и записывать потоки данных, как система обмена сообщениями . Мы можем довольно легко начать с Kafka в Java .

Spark Streaming является частью платформы Apache Spark , обеспечивающей масштабируемую, высокопроизводительную и отказоустойчивую обработку потоков данных . Хотя Spark написан на Scala, он предлагает API-интерфейсы Java для работы с .

Apache Cassandra — это распределенное хранилище данных NoSQL с широкими столбцами . Более подробная информация о Cassandra доступна в нашей предыдущей статье.

В этом руководстве мы объединим их, чтобы создать хорошо масштабируемый и отказоустойчивый конвейер данных для потока данных в реальном времени .

Введение в Apache Lucene

9 октября 2021 г. · 7 мин. чтения

1. Обзор

Apache Lucene — это полнотекстовый поисковый движок, который можно использовать с различными языками программирования.

В этой статье мы попытаемся понять основные концепции библиотеки и создать простое приложение.

2. Настройка Мавена

Для начала давайте сначала добавим необходимые зависимости:

Руководство по анализаторам Lucene

9 октября 2021 г. · 5 мин. чтения

1. Обзор

Анализаторы Lucene используются для анализа текста при индексировании и поиске документов.

Мы кратко упомянули об анализаторах в нашем вводном туториале .

В этом руководстве мы обсудим часто используемые анализаторы, как создать собственный анализатор и как назначить разные анализаторы для разных полей документа .

2. Зависимости Maven

Простой поиск файлов с Lucene

9 октября 2021 г. · 3 мин. чтения

1. Обзор

Apache Lucene — это полнотекстовый поисковый движок, который может использоваться различными языками программирования. Чтобы начать работу с Lucene, см. нашу вводную статью здесь .

В этой быстрой статье мы проиндексируем текстовый файл и найдем образцы строк и текстовые фрагменты в этом файле.

2. Настройка Мавена

Сначала добавим необходимые зависимости:

Memcached против Redis

9 октября 2021 г. · 6 мин. чтения

1. Обзор

В этой статье мы рассмотрим сходства и различия двух популярных баз данных в памяти, Memcached и Redis .

2. Memcached и Redis

Часто мы думаем о кэшировании для повышения производительности при обработке большого объема данных.

Memcached — это система кэширования с распределенной памятью, разработанная для простоты и простоты использования и хорошо подходящая в качестве кэша или хранилища сеансов .

Руководство MongoDB BSON

9 октября 2021 г. · 6 мин. чтения

1. Введение

В этом руководстве мы рассмотрим BSON и то, как мы можем использовать его для взаимодействия с MongoDB .

Подробное описание MongoDB и всех ее возможностей выходит за рамки этой статьи. Тем не менее, будет полезно понять несколько ключевых концепций.

MongoDB — это распределенный механизм хранения документов NoSQL. Документы хранятся как данные BSON и группируются в коллекции. Документы в коллекции аналогичны строкам в таблице реляционной базы данных .

Для более подробного ознакомления ознакомьтесь со вводной статьей о MongoDB .

2. Что такое `БСОН` ?

Введение в Morphia — Java ODM для MongoDB

9 октября 2021 г. · 10 мин. чтения

1. Обзор

В этом руководстве мы поймем, как использовать Morphia , средство сопоставления документов объектов (ODM) для MongoDB в Java.

В процессе мы также поймем, что такое ODM и как он облегчает работу с MongoDB.

2. Что такое `ODM` ?

Для тех, кто не знаком с этой областью, MongoDB — это ориентированная на документы база данных, созданная для естественного распространения . Документно-ориентированные базы данных, говоря простым языком, управляют документами, которые представляют собой не что иное , как бессхемный способ организации полуструктурированных данных . Они подпадают под более широкий и слабо определенный зонтик баз данных NoSQL, названных в честь их явного отклонения от традиционной организации баз данных SQL.

Простая реализация тегов с MongoDB

9 октября 2021 г. · 5 мин. чтения

1. Обзор

В этом руководстве мы рассмотрим простую реализацию тегов с использованием Java и MongoDB.

Для тех, кто не знаком с концепцией, тег — это ключевое слово, используемое в качестве «метки» для группировки документов по разным категориям. Это позволяет пользователям быстро перемещаться по похожему контенту и особенно полезно при работе с большим объемом данных.

При этом неудивительно, что этот метод очень часто используется в блогах. В этом сценарии у каждого сообщения есть один или несколько тегов в соответствии с затронутыми темами. Когда пользователь заканчивает чтение, он может перейти по одному из тегов, чтобы просмотреть больше контента, связанного с этой темой.

Отправка данных операционной системы в эластичный стек (стек ELK)

9 октября 2021 г. · 2 мин. чтения

1. Обзор

В этом кратком руководстве мы обсудим, как отправлять метрики на уровне ОС в Elastic Stack. В качестве эталона мы будем использовать здесь сервер Ubuntu.

Мы будем использовать Metricbeat для сбора данных из операционной системы и периодической отправки их в Elasticsearch.

Если вы заинтересованы в отправке других типов данных в экземпляр ES, ранее мы обсуждали данные JMX и журналы приложений .

2. Установите Метрибит

Удалить все в Redis

9 октября 2021 г. · 4 мин. чтения

1. Обзор

При кэшировании в Redis может быть полезно очистить весь кеш, когда он станет недействительным.

В этом кратком руководстве мы узнаем, как удалить все ключи, присутствующие в Redis, как в определенных базах данных, так и во всех базах данных.

Во-первых, мы рассмотрим командную строку. Затем мы увидим, как сделать то же самое с помощью API и клиента Java.

1. Обзор​

1. Обзор​

2. Настройка Мавена​

1. Обзор​

2. Зависимости Maven​

1. Обзор​

2. Настройка Мавена​

1. Обзор​

2. Memcached и Redis​

1. Введение​

2. Что такое БСОН ?​

1. Обзор​

2. Что такое ODM ?​

1. Обзор​

1. Обзор​

2. Установите Метрибит​

1. Обзор​

2. Запуск Redis​

1. Обзор

1. Обзор

2. Настройка Мавена

1. Обзор

2. Зависимости Maven

1. Обзор

2. Настройка Мавена

1. Обзор

2. Memcached и Redis

1. Введение

2. Что такое `БСОН` ?

1. Обзор

2. Что такое `ODM` ?

1. Обзор

1. Обзор

2. Установите Метрибит

1. Обзор

2. Запуск Redis