Перейти к основному содержимому

6 записей с тегом "HTML"

Посмотреть все теги

· 6 мин. чтения

1. Введение

В этой статье мы представим HtmlUnit, инструмент, который позволяет нам, проще говоря, программно взаимодействовать с HTML-сайтом и тестировать его, используя JAVA API .

2. О HtmlUnit

HtmlUnit — это браузер без графического интерфейса пользователя, предназначенный для программного использования, а не непосредственно пользователем.

Браузер поддерживает JavaScript (через движок Mozilla Rhino ) и может использоваться даже для веб-сайтов со сложными функциями AJAX. Все это можно сделать, имитируя типичный браузер с графическим интерфейсом, такой как Chrome или Firefox.

· 7 мин. чтения

1. Обзор

Иногда нам нужно удалить все теги HTML и извлечь текст из строки документа HTML.

Проблема выглядит довольно просто. Однако, в зависимости от требований, он может иметь разные варианты.

В этом уроке мы обсудим, как это сделать с помощью Java.

2. Использование регулярных выражений

· 6 мин. чтения

1. Введение

В этом руководстве мы опишем, как преобразовать XML в HTML, используя распространенные библиотеки Java и механизмы шаблонов — JAXP, StAX, Freemarker и Mustache .

2. XML для демаршалирования

Давайте начнем с простого XML-документа, который мы преобразуем в подходящее представление Java, прежде чем преобразовывать в HTML. Мы будем иметь в виду несколько ключевых целей:

  1. Сохраняйте один и тот же XML для всех наших образцов
  2. В конце создайте синтаксически и семантически корректный документ HTML5.
  3. Преобразование всех элементов XML в текст

· 5 мин. чтения

1. Обзор

В этом кратком руководстве мы рассмотрим использование OpenPDF в Java для программного преобразования файлов HTML в форматы PDF .

2. ОпенПДФ

OpenPDF — это бесплатная библиотека Java для создания и редактирования PDF-файлов под лицензиями LGPL и MPL. Это форк программы iText. Фактически, до версии 5 код для создания PDF с помощью OpenPDF был почти идентичен API iText. Это хорошо поддерживаемое решение для создания PDF-файлов на Java.

3. Преобразование с помощью летающей тарелки

· 2 мин. чтения

1. Обзор

В этом руководстве мы хотим посмотреть, как вернуть HTML из контроллера Spring MVC.

Давайте посмотрим, что нужно сделать.

2. Зависимость от Maven

Во- первых, мы должны добавить зависимость Maven spring-boot-starter-web для нашего контроллера MVC:

· 7 мин. чтения

1. Обзор

Jsoup — это библиотека Java с открытым исходным кодом, используемая в основном для извлечения данных из HTML. Он также позволяет вам манипулировать и выводить HTML. Он имеет постоянную линию разработки, отличную документацию и удобный и гибкий API. Jsoup также можно использовать для анализа и построения XML.

В этом уроке мы будем использовать блог Spring , чтобы проиллюстрировать упражнение по очистке, демонстрирующее несколько функций jsoup:

  • Загрузка: извлечение и разбор HTML в документ
  • Фильтрация: выбор нужных данных в Elements и их обход
  • Извлечение: получение атрибутов, текста и HTML узлов
  • Модификация: добавление/редактирование/удаление узлов и редактирование их атрибутов

2. Зависимость от Maven