Программирование Java

Оптимизируем Java-приложения с помощью GraalVM

07.03.2022

1495

Оптимизируем Java-приложения с помощью GraalVM

С GraalVM я познакомился два года назад, когда она начала выходить на рынок. И сейчас уже набралось достаточное количество материала для отдельной статьи. Кроме того, на некоторых тренингах мы уже изучаем эту технологию, а я недавно провел по ней воркшоп. Поэтому в этой статье я приведу простые и не очень простые примеры, чтобы наглядно показать преимущества и особенности GraalVM.

Я не буду очень подробно рассказывать теорию и историю GraalVM, тем более, что у меня уже была статья на эту тему. Стараюсь больше внимания уделить практике и, в частности, оптимизации и повышению эффективности. Оптимизацию приложений можно условно разделить на две категории: то, что вы делаете и то, что делают за вас. Первая часть более трудоемка, требующая хорошего технического уровня у разработчика и, в основном, касается повышения эффективности кода и уменьшения объема памяти. Кроме того, она требует тестирования (performance/load/stress) для того, чтобы проверить, что оптимизация действительно принесла пользу проекту.

Вторая категория оптимизации осуществляется автоматически, например Java-компилятором или JIT-компилятором в JVM. Кроме того, есть большое количество опций, позволяющих контролировать этот процесс. Если взять такой код:

private static final int CONNECTION_TIMEOUT = 10;      
private static final int READ_TIMEOUT = 2 * CONNECTION_TIMEOUT;

и выполнить компиляцию нашего проекта, а затем произвести дизассемблирование, то обнаружим, что Java компилятор выполнил сразу две оптимизации:

1) Вычислил значение READ_TIMEOUT, поскольку оно на самом деле является constant expression, как и CONNECTION_TIMEOUT.

2) Заменил все использование наших констант на их значение, поскольку значение константы не может измениться во время работы JVM.

Если взять runtime оптимизацию в JVM, это, например, известная опция -XX:+UseCompressedOops, появившийся в JDK 6 и позволявший использовать сжатые указатели (oops), поскольку указатели в JVM всегда выравниваются на грани слова, и значит последние три биты по адресу можно сэкономить. Тесты показывали, что при включенном флаге программы использовали на 14% меньше памяти и на 24% меньше вызовов GC. А в JDK 7 эта опция включена по умолчанию.

Из новых примеров – это опция Compact Strings, которая появилась в JDK 9 и позволяла сохранять символы в строке (класс String) как массив байт:

@Stable
private final byte[] value;

Если в строке кода все символы не превышают байт, то нам нечего использовать для них кодировку UTF16, а значит, мы можем уменьшить расход памяти в 2 раза (поскольку раньше value было массивом char и на каждый символ приходилось 2 байта). В целом, как мы видим, автоматическая оптимизация очень удобна, потому что достается нам бесплатно, хорошо продумана, протестирована и может быть отключена в редких случаях, когда она не нужна или работает не так, как нам нужно.

Table of Contents

О GraalVM

Теперь вернемся к GraalVM. GraalVM – это новая виртуальная машина, написанная на Java, разработка которой началась в 2019 году. Ее killer-фитча – это interoperability, когда вы можете в одном проекте использовать сразу несколько языков (Java, JavaScript, Python). Но вы можете использовать его и только для Java-проекта, надеясь на улучшенную производительность, заявленную авторами. Уже есть синтетические benchmarks, в которых лидирует GraalVM Enterprise Edition, правда в них использовались версии Java 8 и 11. Давайте в качестве эксперимента протестируем GraalVM разных изданий и OpenJDK, но 17-й (текущей стабильной LTS) версии. Отличие Enterprise от Community Edition по быстродействию в том, что в первом добавлено больше возможностей для оптимизации, таких как улучшенная векторизация в циклах, path duplication и многое другое. Но она бесплатна только для разработки и исследования, для коммерческого использования необходимо приобрести лицензию. Кроме того, только в Enterprise Edition доступен сборщик мусора G1, а в Community редакции – есть только Serial GC.

В качестве тестируемого кода возьмем метод, который заполняет Map целыми числами:

public static Map<Integer, Integer> fillMap(int size) {
       return IntStream.range(0, size).boxed()
              .collect(Collectors.toMap(i -> i, i -> i));
}

Такой код выбран потому, что достаточно прост и использует самые популярные Java-фичи – коллекции и Stream API. Benchmark также выглядит довольно стандартно. Единственное, что я добавил параметризацию, указав с помощью аннотации @Param несколько значений аргументов:

@Param({"1", "100", "10000"})
private int size;   
@Benchmark
public Map<Integer, Integer> fillMapTest() {
     return CollectionUtils.fillMap(size);
}

Конфигурация для benchmarks:

JMH 1.33
Intel Core i9, 8 cores
32 GB
10 итераций вычисления, 10 итераций прогрева (warm-up)
Результаты вычислений (наносекунды/операцию):

# елементів	Oracle JDK 17.0.2	GraalVM Community 22.0.0.2	GraalVM Enterprise 22.0.0.2
1	69	73	11
100	1249	2140	1157
10000	112636	183323	121250

Как мы видим, GraalVM Community Edition проигрывает Oracle JDK от 5% до 70%, и чем больше элементов, тем больше проигрыш. Производительность в GraalVM Enterprise Edition тоже падает с увеличением количества элементов, но в первых двух тестах он опережает Oracle JDK, причем в первом тесте в 7(!) раз. Эти benchmarks подтверждают, что GraalVM действительно может работать быстрее своих конкурентов. Но за это предпочтение приходится платить (в прямом смысле).

Об утилите Native Image

Теперь я хочу рассказать о еще одной killer-фиче GraalVM — утилите Native Image. Мы с вами привыкли к слогану «Write once, run anywhere», о котором обязательно рассказывают на вводной лекции или семинаре по Java. В 1995 году, когда все только начиналось, это было очень сильным доводом в пользу выбора Java, ведь позволяло скомпилировать проект в промежуточный байт-код, а затем запустить на любой ОС, для которой выпущена JRE. Но с тех пор прошло 27 лет и несколько раз менялась парадигма Java-приложений:

Сначала мы собирали проекты как WAR-файлы и деплоили на веб-сервер (или сервер приложений).
Затем, с появлением Spring Boot, стало возможно упаковывать приложение в виде JAR-файла и запускать его как консольный.
После появления Docker приложения (и сервисы) стали поставляться в виде images, что позволило решить множество проблем с безопасностью, конфигурацией и изоляцией от других приложений – идеальный вариант для использования для микросервисов.
Но здесь не все было гладко. Микросервисы должны быть быстрыми и компактными, а результативный Docker image был довольно громоздким. К примеру, если мы возьмем все, что нужно для запуска минимального Spring Boot программы на Ubuntu:

Spring Boot зависимости – 15 Мб.
JDK 11 — 250 Мб.
Ubuntu (tools) – 35 Мб.
Ubuntu (basic layer) – 60 Мб.
то будет иметь минимальный размер image 360 Мб. В последний год ситуация несколько улучшилась:

1) В JDK 16 сделали портировки из библиотеки zlibc на musl, что позволило запускать Java-приложения на Alpine Linux (а это всего 4 Мб), а не на Ubuntu.

2) В JDK 9 появилась утилита jlink, которая может выбросить из JDK модули, которые не используются вашим приложением, по существу создав аналог JRE. Но она работает не совсем стабильно, и ее использование не так просто автоматизировать.

Кроме того, с появлением Docker images, слоган Write once, run anywhere потускнел, потому что теперь мы точно знаем, на какой ОС будем запускать приложение и кроссплатформенность нам больше не нужна. А это значит, что мы можем скомпилировать наше приложение в AOT (ahead-of-time) режиме, создав бинарный файл с машинными инструкциями и забыв про байт-код. При этом нам, разработчикам, очень важно, чтобы:

1) Нативное приложение (или native image) работало так же, как и в варианте с байт-кодом.

2) Компиляция в нативном коде была максимально быстрой и стабильной (отсутствие ошибок).

3) Поддерживались фичи, делающие жизнь девелопера приятной (наладка, логирование, тестирование и многое другое).

Для примера возьмем самое простое Java SE приложение и попробуем шаг за шагом оптимизировать:

public class HelloWorld {
       public static void main(String[] args) {
              System.out.println("Hello, IT-Discovery!");
       }
}

Если мы захотим упаковать его в Docker image, то Dockerfile будет примерно таким:

FROM openjdk:17-alpine
 COPY src/main/java/HelloWorld.java /sources/
WORKDIR /sources
RUN javac HelloWorld.java && rm HelloWorld.java
 CMD java HelloWorld

Размер Docker image — 326 Мб. К сожалению, мы не можем использовать JRE для запуска приложения, так как из 12 версии Java они официально не выпускаются. Как создать native image? Для этого необходимо выполнить 4 этапа:

1) Загрузить GraalVM.

2) Установить утилиту native-image с помощью установщика gu, поскольку она не входит в стандартный дистрибутив.

3) Скомпилировать наше приложение Java компилятором.

4) Запустить native-image и получить бинарный исполняемый файл для требуемой ОС.

Проще всего это описать в новом Dockerfile, где мы используем multi-stage build:

FROM ghcr.io/graalvm/graalvm-ce:java17-21.3.0 as graalvm
 RUN gu install native-image
 COPY src/main/java/HelloWorld.java /sources/
WORKDIR /sources
RUN javac HelloWorld.java
 RUN native-image HelloWorld
 FROM ubuntu
 COPY --from=graalvm /sources/helloworld /helloworld
 ENTRYPOINT ["./helloworld"]

Первая стадия (на базе GraalVM Community Edition) для сборки, вторая стадия (на базе Ubuntu) для запуска. К сожалению, Docker images для Enterprise Edition нет. Нам по-прежнему нужно использовать Ubuntu, потому что там содержатся необходимые системные библиотеки для коммуникации с ОС. Время компиляции – 22 секунды. Размер Docker Image – 88 Мб (в 3,5 раза меньше). Каким образом достигается такой выигрыш?

Секрет в том, что в сгенерированном исполняемом файле есть все: и ваше приложение, и все связанные зависимости, и даже JDK, но при этом включается процесс tree-shaking, когда удаляются все неиспользуемые классы. Такой процесс очень популярен в мире фронтенда, теперь он доступен и нам.

Но как быть с магическими фичами, например, динамическая загрузка классов или Reflection API? Они просто не будут работать, потому что байт-кода классов больше нет. В native image все классы, весь код загружаются сразу. Но здесь есть нюансы. Если вы напишете следующий код:

System.out.println(String.class.getInterfaces().length);

то он будет работать и выведет «5», потому что Native image достаточно интеллектуален, чтобы выполнить этот код на стадии сборки и заменить его на 5. А вот такой код уже работать не будет:

System.out.println(String.class.getDeclaredMethods().length);

Но здесь можно найти выход. Мы привыкли к тому, что код выполняется на стадии загрузки программы. Но есть достаточно инновационные технологии (Dagger, Micronaut), где часть работы выполняется при компиляции программы. Это позволяет как ускорить старт программы, так и отказаться от магических фич, таких как Reflection, AOP и многих других.

У GraalVM Native image до 19-й версии вся статическая инициализация выполнялась при составлении. Но иногда это приводило к нежелательным эффектам, и поэтому с 19 версии такая инициализация выполняется в run-time. Но это можно настроить. Если мы напишем следующий код:

private static int length = String.class.getDeclaredMethods().length;      
public static void main(String[] args) {
       System.out.println(length);
}

Так он по умолчанию не будет работать. Но мы можем добавить наш класс в список классов, где статическая инициализация будет производиться на стадии составления:

RUN native-image --initialize-at-build-time=HelloWorld HelloWorld

И тогда поле length будет вычислено заранее, и при исполнении будет равна 141. Это дает нам хорошие возможности для оптимизации кода, поскольку мы можем много статических вещей сделать еще в build-time. Но если это невозможно, то придется написать специальный конфигурационный файл reflect-config.json:

[
  {
    "name" : "java.lang.String",
    "allDeclaredConstructors" : true,
    "allPublicConstructors" : true,
    "allDeclaredMethods" : true,
    "allPublicMethods" : true,
    "allDeclaredClasses" : true,
    "allPublicClasses" : true
  }
]

И передать его в native-image, чтобы он сохранил всю эту метаинформацию о классе String:

RUN native-image -H:ReflectionConfigurationFiles=reflect-config.json HelloWorld

К сожалению, этот минус, который может осложнить нам жизнь, разработчикам. Очень многие Java-фичи требуют создания следующих файлов:

1) Reflection API.

2) AOP прокси.

3) Использование ресурсов.

4) Сериализация.

Но есть способ это автоматизировать, мы о нем спустя немного поговорим. А пока вернемся к нашему Dockerfile. К счастью, в GraalVM есть поддержка static images, когда в исполняемом файле хранятся еще и системные библиотеки — zlibc (по умолчанию) или musl:

RUN native-image --static HelloWorld

А это позволяет нам вообще больше не использовать базовую ОС для запуска приложения:

FROM scratch

В результате получим следующий Dockerfile:

FROM ghcr.io/graalvm/graalvm-ce:java17-21.3.0 as graalvm
RUN gu install native-image
COPY src/main/java/HelloWorld.java /sources/
WORKDIR /sources
RUN javac HelloWorld.java
RUN native-image --static HelloWorld
FROM scratch
COPY --from=graalvm /sources/helloworld /helloworld
ENTRYPOINT ["./helloworld"]

Время компиляции – 22 секунды. Размер Docker image — 16 Мб. Но это число можно уменьшить с помощью упаковщиков исполняемых файлов, таких как UPX. UPX чем-то похож на архиватор, но его задача сложнее – нужно сжать файл, выполняемый так, чтобы его тоже можно было запускать. Для UPX добавим еще одну (вторую) стадию:

FROM ubuntu as ubuntu
RUN apt-get update && apt-get install -y upx
COPY --from=graalvm /sources/helloworld /opt/
RUN upx /opt/helloworld

Время сборки 23 секунды. Размер Docker image — 5 Мб. Можно еще больше попытаться сжать исполняемый файл, указав алгоритм сжатия LZMA, а не дефолтный UCL:

RUN upx --lzma /opt/helloworld

Время сборки увеличилось до 26 секунд, размер Docker image 3.8 Мб. Таким образом, с помощью GraalVM и UPX мы снизили размер Docker image (а по сути приложения) с 326 до 3.8 Мб. Итоговый Dockerfile:

FROM ghcr.io/graalvm/graalvm-ce:java17-21.3.0 as graalvm
RUN gu install native-image
COPY src/main/java/HelloWorld.java /sources/
WORKDIR /sources
RUN javac HelloWorld.java
RUN native-image --static HelloWorld
FROM ubuntu as ubuntu
RUN apt-get update && apt-get install -y upx
COPY --from=graalvm /sources/helloworld /opt/
RUN upx --lzma /opt/helloworld
FROM scratch
COPY --from=ubuntu /opt/helloworld /helloworld
 ENTRYPOINT ["./helloworld"]

Поддержка community

В этой статье я рассмотрел тривиальный пример. Но что если у нас реальный проект, где больше 100 посторонних библиотек и размер дистрибутива под 60 Мб? Здесь есть три варианта:

1) Можно использовать Maven/Gradle плагины для GraalVM native image. Но вам придется вручную писать все эти конфигурационные JSON-файлы.

2) Если у вас Spring Boot, то вы можете использовать проект Spring Native и Spring AOT плагин. Этот плагин при составлении анализирует classpath и сам генерирует нужные конфигурационные JSON-файлы. Он пока находится в статусе экспериментального и выход версии 1.0 планируется тогда, когда выход Spring 6/Spring Boot 3 (сентябрь-октябрь 2022 года).

3) Если у вас современные микровеб-фреймворки (Micronaut), то скорее всего, вам не нужно будет писать никаких файлов, потому что эти технологии практически не используют магических Java фич, а генерируют конфигурацию при сборке.

4) Если у вас приложение на базе Java EE (Jakarta EE, Eclipse Microprofile), то здесь всё сложнее. Только Quarkus полностью поддерживает Native Image. В других случаях он вам недоступен.

Но именно в реальных приложениях можно оценить плюсы native image. Если в обычном варианте Spring Boot приложение будет стартовать минимум 2-3 секунды, то native-варианте – всего 50 мс. Разумеется, и здесь есть свои сложности (надеюсь, временные). Есть проекты, которые по своему дизайну просто не поддерживают native image — например, Log4j 2. Есть слухи, что это исправят в Log4j 3, но когда он выйдет неизвестно.

Есть много библиотек (Mockito, Liquibase), для которых еще не созданы конфигурационные файлы и к сожалению, если они есть в вашем проекте, то вы просто не сможете создать native image.

Выводы

В этой статье мы по шагам рассмотрели стадии оптимизации упаковки Java приложения в Docker image:

1) Начальный размер – 326 Мб.

2) Первый вариант native image – 87 Мб.

3) Использование static images — 16 Мб.

4) Упаковка UPX – 5 Мб.

5) Использование алгоритма LZMA – 3. 8 Мб.

Да, UPX никак не относится к GraalVM, но если бы не было native image, мы бы никак не смогли использовать и UPX.

Говорят ли эти цифры о том, что нужно бросить все текущие задания и срочно переходить на GraalVM Native Image? Вовсе нет, и сразу по двум причинам. Во-первых, не каждая библиотека адаптирована под него, и если у вас в проекте есть хотя бы одна технология, не поддерживающая native image, вы не сможете его использовать. Во-вторых, AOT режим дает быстрый старт приложения, но при этом у JIT режиме есть больше возможностей для runtime оптимизации. Так что такой переход требует перед началом основательных benchmarks.

Какое будущее ждет GraalVM? Я хорошо помню 2015 год, когда только появились первые отзывы о Docker, и многим казалось, что это несерьезное и не стоит рассмотрения. Сейчас возможно айтишники, которые не работали с Docker, но нет тех, кто не слышал о нем и контейнерах. Я уверен, что если у разработчиков GraalVM не снизится мотивация и быстрота разработки, то в будущем использование этой технологии станет рядовым и привычным событием.

К сожалению, как и в случае Kotlin или Scala компилятора, время компиляции – ахиллесовая пятка GraalVM. Для достаточно больших программ оно может занимать 3 – 5 минут (ведь здесь еще прибавится запуск тестов в native environment). Но результаты последних benchmarks дают повод для оптимизма:

#Оптимизируем Java-приложения

Оптимизируем Java-приложения с помощью GraalVM

О GraalVM

Об утилите Native Image

Поддержка community

Выводы

Популярное

Разработка игр на языке JavaScript

Современный сброс стилей CSS

Как запустить Node.js после его установки?

Web Developers Reference Guide

Горячее

Друзья, совсем скоро – 12 апреля состоится карьерный форум #Найти_IT в...

Напишите минимальный неблокирующий стек (всего два метода — push() и pop()).

Как получить дамп потока?

Зефирная планета в 580 световых годах от Земли

Выбор редактора

Оптический диск типа DVD может хранить 1,6 петабита (или 200 терабайт)...

❤️🙏 Путь к мечте: как инвалидность не помешала стать разработчиком и...

Подборка облачных хранилищ и файлообменников

Популярные посты

Логическая задача про 51 рубль

Создаем многопользовательскую веб-игру Javascript

Топ самых сильных IT университетов в России 2023

ПОПУЛЯРНЫЕ КАТЕГОРИИ

Java от Oracle снова бесплатна — Free Java License

Чем полезны неизменяемые объекты?