Перейти к основному содержимому

150 записей с тегом "Данные"

Посмотреть все теги

· 5 мин. чтения

1. Обзор

Когда производитель отправляет сообщение в Apache Kafka, он добавляет его в файл журнала и сохраняет в течение настроенного периода времени.

В этом руководстве мы научимся настраивать свойства хранения сообщений на основе времени для тем Kafka .

2. Удержание на основе времени

При заданных свойствах срока хранения сообщения имеют TTL (время жизни) . По истечении срока действия сообщения помечаются для удаления, тем самым освобождая место на диске.

· 18 мин. чтения

1. Обзор

В этом уроке мы углубимся в аннотации Джексона .

Мы увидим, как использовать существующие аннотации, как создавать собственные и, наконец, как их отключить.

2. Аннотации сериализации Джексона

· 6 мин. чтения

1. Обзор

Хотя JSON и XML являются широко популярными форматами передачи данных, когда речь идет о REST API, они не единственные доступные варианты.

Существует много других форматов с различной степенью сериализации и размером сериализованных данных.

В этой статье мы рассмотрим, как настроить механизм Spring REST для использования двоичных форматов данных, что мы проиллюстрируем с помощью Kryo.

Кроме того, мы показываем, как поддерживать несколько форматов данных, добавляя поддержку буферов протокола Google.

2. HttpMessageConverter

· 7 мин. чтения

1. Обзор

В этой статье мы рассмотрим платформу Mantis, разработанную Netflix.

Мы рассмотрим основные концепции Mantis, создав, запустив и исследуя задание потоковой обработки.

2. Что такое богомол?

** Mantis — это платформа для создания приложений (задания) для потоковой обработки . Он обеспечивает простой способ управления развертыванием и жизненным циклом заданий. Кроме того, это облегчает распределение ресурсов, обнаружение и связь между этими заданиями.**

· 20 мин. чтения

1. Введение

В этом руководстве мы рассмотрим основные концепции разделения ответственности командных запросов (CQRS) и шаблонов проектирования Event Sourcing.

Хотя шаблоны часто называют взаимодополняющими, мы попытаемся понять их по отдельности и, наконец, посмотрим, как они дополняют друг друга. Существует несколько инструментов и фреймворков, таких как Axon , которые помогают использовать эти шаблоны, но мы создадим простое приложение на Java, чтобы понять основы.

2. Основные понятия

Сначала мы поймем эти шаблоны теоретически, прежде чем пытаться их реализовать. Кроме того, поскольку они достаточно хорошо представляют собой отдельные паттерны, мы постараемся понять их, не смешивая их.

· 5 мин. чтения

1. Обзор

Структура данных HyperLogLog (HLL) — это вероятностная структура данных, используемая для оценки кардинальности набора данных .

Предположим, что у нас есть миллионы пользователей, и мы хотим подсчитать количество отдельных посещений нашей веб-страницы. Наивной реализацией было бы хранить каждый уникальный идентификатор пользователя в наборе, и тогда размер набора был бы нашей кардинальностью.

Когда мы имеем дело с очень большими объемами данных, подсчет кардинальности таким образом будет очень неэффективным, поскольку набор данных будет занимать много памяти.

Но если нас устраивает оценка в пределах нескольких процентов и нам не нужно точное количество уникальных посещений, то мы можем использовать HLL , так как он был разработан именно для такого варианта использования — оценки количества миллионов или даже миллиардов. различных значений .

2. Зависимость от Maven

· 4 мин. чтения

1. Обзор

Типичным вариантом использования при работе с JSON является выполнение преобразования из одной модели в другую. Например, нам может понадобиться разобрать сложный, плотно вложенный граф объектов в более простую модель для использования в другой области.

В этой быстрой статье мы рассмотрим, как отображать вложенные значения с помощью Jackson , чтобы сгладить сложную структуру данных. Мы будем десериализовать JSON тремя разными способами:

  • Использование @JsonProperty
  • Использование JsonNode
  • Использование пользовательского JsonDeserializer

2. Зависимость от Maven

· 3 мин. чтения

1 . Обзор

В этой статье мы рассмотрим API потоковой передачи Jackson. Он поддерживает как чтение, так и запись, и с его помощью мы можем писать высокопроизводительные и быстрые парсеры JSON.

С другой стороны, его немного сложно использовать — каждую деталь данных JSON необходимо явно обрабатывать в коде.

2. Зависимость от Maven

Во- первых, нам нужно добавить зависимость Maven к jackson-core :

· 4 мин. чтения

1. Обзор

В этой статье мы узнаем, как использовать собственный маппер с библиотекой MapStruct .

Библиотека MapStruct используется для отображения между типами компонентов Java . Используя пользовательский сопоставитель с MapStruct , мы можем настроить методы сопоставления по умолчанию.

2. Зависимости Maven

Давайте добавим библиотеку mapstruct в наш Maven pom.xml :

· 7 мин. чтения

1. Введение

Обработка графов полезна для многих приложений от социальных сетей до рекламы. В сценарии с большими данными нам нужен инструмент для распределения этой вычислительной нагрузки.

В этом руководстве мы загрузим и изучим возможности графа с помощью Apache Spark в Java. Чтобы избежать сложных структур, мы будем использовать простой и высокоуровневый API графа Apache Spark: API GraphFrames.

2. Графики

Прежде всего, давайте определим граф и его компоненты. Граф — это структура данных, имеющая ребра и вершины. Ребра несут информацию , которая представляет отношения между вершинами.