JVM GC 性能测试系列:
JVM GC 性能对比方法
JVM GC 性能测试(一):相同流量
JVM GC 性能测试(二):递增流量
JVM GC 性能测试(三):真实流量
书接上文,在 JVM GC 性能测试(二):递增流量 的最后,D瓜哥提到了一个问题,对于在 JVM GC 性能测试(一):相同流量 和 JVM GC 性能测试(二):递增流量 中存在的巨大 QPS 差异疑惑不解。所以,D瓜哥决定将测试机器接入到线上环境,在真实访问中,观察各个 GC 的表现。
一言以蔽之 J21-Gen-ZGC 和 J21-G1 无论在稳定性,吞吐量以及响应时效性上都非常优秀。
再极端峰值情况,J21-G1 是更好的选择,更加稳定,不容易出凸点。
日常使用,J21-Gen-ZGC 响应性更好,接口耗时更低。
鉴于 OpenJDK 21 G1 GC 一如既往的惊艳表现,D瓜哥准备整理一下 G1 GC 的主要优化,敬请关注: Java G1 垃圾收集器主要优化。
1. 服务调用监控数据 监控服务调用的相关数据,这是对于用户来说,感知最强烈的相关数据,也是直接关系到服务质量的数据。
1.1. 服务调用次数 从调用次数上来看,五个分组没有大的变化,可以说根本没有达到系统的极限峰值。当然,这才是正常现象,如果日常运行都爆峰值,那说明系统早该扩容了。
图 1. 服务调用次数(秒级) 图 2. 服务调用次数(分钟级) 1.2. 服务调用耗时 整体上讲,J21-Gen-ZGC 的耗时更短,从数据上来看,TP999 能比 J21-G1 的少 10~20ms;TP99 更加夸张,J21-Gen-ZGC 的耗时只有 J21-G1 的一半。
J21-Gen-ZGC 和 J21-G1 还是一如既往的稳。
这次测试中,J17-ZGC 也很稳,有些出乎意料。但是,结合下面 JVM CPU 使用率 和 系统 CPU 使用率 来看,J17-ZGC 和 J21-ZGC 的 CPU 使用率早早就达到 90%+,再结合上面两个测试,从稳定性来看,J17-ZGC 和 J21-ZGC 只能被排除掉。
JVM GC 性能测试系列:
JVM GC 性能对比方法
JVM GC 性能测试(一):相同流量
JVM GC 性能测试(二):递增流量
JVM GC 性能测试(三):真实流量
在上一篇文章 JVM GC 性能测试(一):相同流量 中,D瓜哥使用一个总量请求对所有分组的所有机器进行性能测试。但是,经过测试发现了一个问题,同时产生了另外一个问题,有两个问题没有得到很好的解答:
由于服务响应时长直接关系到服务调用次数,当某一台机器出现问题时,整体调用次数就会急剧下降,调用次数加不上去。一个机器出问题,所有机器的访问量就上不去了。这是测试中发现的一个问题。当然,这属于测试工具的问题,别不是 GC 的问题。但是,也影响到我们的压测,也需要解决。
上次测试,这是针对某一个指定服务调用量进行性能测试,那么,无法确定每个 GC 能支撑的极限调用峰值。另外,在极限峰值和超极限峰值的情况下,各个 GC 的表现如何?这个也有待验证。
针对上述两个问题,设计了本次测试。测试方法如下:
各个分组使用一套相同的流量策略:
各个分组几乎同时开始执行测试任务;
调用量从低到高,以此同时使用相关的调用量进行测试;
除最开始预热阶段的调用量外,后续每个调用量都持续进行十分钟的测试。
针对每个 GC 分组单独设定一套调用发量程序,这个保证各个 GC 分组直接不相互影响。
最后,再分析调用量相同时段的各个 GC 表现,就可以看到各个 GC 的极限峰值。
为了保留更多细节,本文所有截图都是在 34 吋带鱼屏下,使用全屏模式展示并截图的。如果看不清楚,可以右击在新页面打开图片来查看。 具体流量及时间段:
750, 23:14:30 ~ 23:19:30
800, 23:19:30 ~ 23:29:30
850, 23:29:30 ~ 23:39:30
900, 23:39:30 ~ 23:49:30
950, 23:49:30 ~ 23:59:30
1000,23:59:30 ~ 00:09:30
1050,00:09:30 ~ 00:19:30
1100,00:19:30 ~ 00:29:30
JVM GC 性能测试系列:
JVM GC 性能对比方法
JVM GC 性能测试(一):相同流量
JVM GC 性能测试(二):递增流量
JVM GC 性能测试(三):真实流量
在上一篇文章 JVM GC 性能对比方法 介绍了性能对比的方法,这篇文章就根据该方法对上述提到的5种 JVM GC 进行性能测试。
在正式测试之前,D瓜哥进行了多次小流量试探性测试,来探索一个合适的量。找到一个比较平稳的量后,乘以机器数量,获得一个每秒总计请求量,最后使用该总量数据去做压测。
根据多次测试的数据来看,最后选择的是每台每秒 500 QPS,5 个分组,每个分组 5 台机器,所以,每秒的请求总量是: 500 * 5 * 5 = 12500 QPS;每个分组每分钟的总量是:500 * 5 * 60 = 150000 QPS。使用每台机器以此使用 100 QPS,200 QPS,300 QPS,400 QPS 各运行一分钟来对系统进行预热。最后以每台每秒 500 QPS 的访问量来对测试机器进行持续十分钟的性能测试,最后分析这十分钟的相关数据。
一言以蔽之 服务稳定性:J21-Gen-ZGC、J21-G1、J8-G1 稳定性最好;J17-ZGC 有轻微波动;J21-ZGC 有剧烈波动;
服务耗时 TP999:J21-Gen-ZGC < J17-ZGC < J21-G1 < J8-G1 < J21-ZGC;
CPU 消耗:J21-G1 < J8-G1 < J17-ZGC < J21-Gen-ZGC < J21-ZGC;
JVM GC 性能测试系列:
JVM GC 性能对比方法
JVM GC 性能测试(一):相同流量
JVM GC 性能测试(二):递增流量
JVM GC 性能测试(三):真实流量
现在部门内部绝大部分应用都还在使用 OpenJDK 8,计划推进部门升级 JDK 到 OpenJDK21。本着实事求是,用数据说话的原则,准备对如下 GC 做性能测试:
OpenJDK 8 G1 GC(以下称 J8-G1。具体版本号:1.8.0_321-b07。)
OpenJDK 17 ZGC(以下称 J17-ZGC。具体版本号:17.0.9+9。)
OpenJDK 21 G1(以下称 J21-G1。具体版本号:21.0.2+13-LTS。)
OpenJDK 21 ZGC(以下称 J21-ZGC。具体版本号:21.0.2+13-LTS。)
OpenJDK 21 Gen ZGC(以下称 J21-Gen-ZGC。具体版本号:21.0.2+13-LTS。)
所有 OpenJDK 版本都是选用相同大版本号里的最高的版本。所有的机器都是 4C8G 的配置,JVM 堆栈内存设置为 4608M 。 为了减少不必要的干扰,JVM 相关参数也尽可能做到了一致或者接近。(等测试完,D瓜哥会把相关参数也分享出来。)
测试对象 由于D瓜哥所处的部门是一个直接面向用户的线上业务部门,所以,大部分系统是直接面对用户,接受用户访问的在线业务系统。所以,为了服务线上业务系统的需求,测试对象的选择就限定在了类似的场景中。测试对象是线上接受用户访问的一个服务。结构如下:
图 1. 压测接口依赖关系图 该接口有外部依赖服务,也有数据库查询,是一个微服务架构下典型的在线服务接口。
测试方法 原本计划是想直接通过上线,将线上不同分组的机器使用不同的 GC 来做测试,但是,这样面临好几个问题:
问题 什么是大页(Large Page)?什么是透明大页(Transparent Huge Page)?它对我有什么帮助?
理论 虚拟内存现在已被视为理所当然。现在只有少数人还记得,更不用说做一些“真实模式”编程了,在这种情况下,你会接触到实际的物理内存。相反,每个进程都有自己的虚拟内存空间,该空间被映射到实际内存上。例如,两个进程在相同的虚拟地址 0x42424242 上拥有不同的数据,而这些数据将由不同的物理内存支持。现在,当程序访问该地址时,应将虚拟地址转换为物理地址。
图 1. 虚拟内存地址与物理内存地址之间的关系 这通常由操作系统维护 “页表”,硬件通过“页表遍历”来实现地址转换。如果在页面粒度上维护翻译,整个过程就会变得简单。但这样做的成本并不低,而且每次内存访问都需要这样做!因此,还需要对最新的翻译进行小型缓存,即 转译后备缓冲区(Translation Lookaside Buffer (TLB))。TLB 通常很小,只有不到 100 个条目,因为它的速度至少要与 L1 缓存相当,甚至更快。对于许多工作负载来说,TLB 未命中和相关的页表遍历需要大量时间。
既然我们无法将 TLB 做得更大,那么我们可以做其他事情:制作更大的页面!大多数硬件有 4K 基本页和 2M/4M/1G “大页”。用更大的页来覆盖相同的区域,还能使页表本身更小,从而降低页表遍历的成本。
在 Linux 世界中,至少有两种不同的方法可以在应用程序中实现这一点:
hugetlbfs。切出系统内存的一部分,将其作为虚拟文件系统公开,让应用程序通过 mmap(2) 从其中获取。这是一个特殊的接口,需要操作系统配置和应用程序更改才能使用。这也是一种“要么全有,要么全无”的交易:分配给 hugetlbfs(持久部分)的空间不能被普通进程使用。
透明大页(Transparent Huge Pages (THP))。让应用程序像往常一样分配内存,但尽量以透明方式为应用程序提供大容量页面支持的存储空间。理想情况下,不需要更改应用程序,但我们会看到应用程序如何从了解 THP 的可用性中获益。但在实际应用中,会产生内存开销(因为会为小文件分配整个大页面)或时间开销(因为 THP 有时需要对内存进行碎片整理以分配页面)。好在有一个中间方案:通过 madvise(2) 可以让应用程序告诉 Linux 在哪里使用 THP。
不明白为什么术语中会交替使用 "large "和 "huge"。总之,OpenJDK 支持这两种模式:
$ java -XX:+PrintFlagsFinal 2>&1 | grep Huge bool UseHugeTLBFS = false {product} {default} bool UseTransparentHugePages = false {product} {default} $ java -XX:+PrintFlagsFinal 2>&1 | grep LargePage bool UseLargePages = false {pd product} {default}
“JVM 剖析花园”是由 JVM 研发专家及性能极客 Aleksey Shipilëv 撰写的一个系列文章,专门介绍一些有关 JVM 的基本知识。笔者也是前几年无意间发现的一片宝藏文章。早就有翻译过来,介绍给大家的想法,可惜一直未能付诸实践。最近在查资料时,无意间又翻到了这个系列,遂下定决心,完成这个萌发已久的小想法。
为了便于理解,对该系列的名字做了微调,原文是“JVM Anatomy Quarks”,将原文的“Quarks”(夸克)翻译为了“花园”。
“JVM 解剖花园”是一个正在进行中的小型系列文章,每篇文章都会介绍一些有关 JVM 的基本知识。这个名字强调了一个事实,即单篇文章不能孤立地看待,这里描述的大部分内容都会很容易地相互影响。
阅读这篇文章大约需要 5-10 分钟。因此,它只针对单一主题、单一测试、单一基准和单一观察进行深入探讨。这里的证据和讨论可能是轶事,并没有对错误、一致性、写作风格、语法和语义错误、重复或一致性进行实际审查。请自行承担使用和/或信任的风险。
以上是该系列介绍。这里介绍一次,后续文章不再赘述。 问题 众所周知,Hotspot 可以进行 锁粗化优化,有效合并多个相邻的锁定块,从而减少锁定开销。它能有效地对如下代码做优化:
synchronized (obj) { // statements 1 } synchronized (obj) { // statements 2 } 优化后:
synchronized (obj) { // statements 1 // statements 2 } 现在,今天提出的一个有趣问题是:Hotspot 是否会对循环进行这种优化?例如:
for (...) { synchronized (obj) { // something } } 是否会被优化成如下这样:
synchronized (this) { for (...) { // something } } 理论上,没有什么能阻止我们这样做。我们甚至可以把这种优化看作是 循环判断外提,只不过这里是针对锁而已。然而,这样做的缺点是有可能使锁变得过于粗糙,从而导致特定线程在执行大循环时占用锁。
实验 要回答这个问题,最简单的方法就是找到当前 Hotspot 优化的正面证据。幸运的是,有了 JMH,这一切都变得非常简单。它不仅有助于建立基准,还有助于工程中最重要的部分—基准分析。让我们从一个简单的基准检查程序开始:
@Fork(..., jvmArgsPrepend = {"-XX:-UseBiasedLocking"}) @State(Scope.Benchmark) public class LockRoach { (1) int x; @Benchmark @CompilerControl(CompilerControl.Mode.DONT_INLINE) public void test() { for (int c = 0; c < 1000; c++) { synchronized (this) { x += 0x42; } } } } 1 完整代码在 这里。 这里有几个重要的技巧:
使用 -XX:-UseBiasedLocking 禁用偏向锁可以避免更长的预热时间,因为偏向锁不会立即启动,而是会在初始化阶段等待 5 秒(参见 BiasedLockingStartupDelay 选项)。
禁用 @Benchmark 的方法内联有助于在反汇编时将其分离。
增加一个神奇的数字 0x42,有助于在反汇编中快速找到增量。
在 Java 虚拟机操作码探秘:常量指令 中对 Java 虚拟机操作码中关于常量操作的指令(操作码)做了初步介绍。估计会有人疑问:文中的“栈”、“栈顶”等是什么?接下来就准备解答这些疑问。
在答疑解惑之前,先来了解一下 Java 编译器对 Java 代码中的代码块是如何处理的?常见的代码块有普通代码块和静态代码块,下面对其做分别介绍。由于涉及到构造函数,所以,先对构造函数做一个介绍。
构造函数 无构造函数 先来看看当没有声明构造函数时,编译结果是什么样的:
/** * 无构造函数示例 * * @author D瓜哥 · https://www.diguage.com */ public class Example { } 编译后,使用 javap -c 查看一下编译结果:
$ javap -c Example Compiled from "Example.java" public class Example { public Example(); Code: 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return } 从结果上来看:编译器自动给没有声明构造函数的类,生成了一个无参构造函数,并且在其中调用了父类(这里是 Object)的无参构造函数。这是大家都熟知的基础知识。
有参构造函数 再来看看当有声明参数的构造函数时,编译结果是什么样的:
/** * 有参构造函数示例 * * @author D瓜哥 · https://www.diguage.com */ public class Example { public Example(int i) { } } 编译后,使用 javap -c 查看一下编译结果:
$ javap -c Example Compiled from "Example.java" public class Example { public Example(int); (1) Code: 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return }
在 Java 虚拟机指令(操作码)集 中给出了一个操作码的列表。针对所有的指令,仅仅给出了一个大概介绍,对理解来说可以说毫无助力。为了弥补这个短板,这里也学习 “Hessian 协议解释与实战”系列 那样,来一个详细解释和实战,配合实例来做个深入分析和讲解。这是这个系列的第一篇文章,就以列表中第一部分“常量”指令开始。
从 Java 虚拟机指令(操作码)集 列表上来看,一共 21 个指令;按照处理数据的类型,合并同类项后,剩下有 nop、 aconst_null、 iconst_<i>、 lconst_<l>、 fconst_<f>、 dconst_<d>、 bipush、 sipush、 ldc 和 ldc2_w 等几个指令。下面,按照顺序,对其进行一一讲解。
操作码助记符的首字母一般是有特殊含义的,表示操作码所作用的数据类型: i 代表对 int 类型的数据操作; l 代表 long; s 代表 short; b 代表 byte;c 代表 char;f 代表 float, d 代表 double; a 代表 reference。
尖括号之间的字母指定了指令隐含操作数的数据类型,<n> 代表非负的整数; <i> 代表是 int 类型数据; <l> 代表 long 类型; <f> 代表 float 类型; <d> 代表 double 类型。
另外还需要指出一点:这种指令表示法在整个 Java 虚拟机规范之中都是通用的。
nop 根据 Chapter 6. The Java Virtual Machine Instruction Set:nop 来看,就是“Do nothing”,暂时没有找到使用方法。就不做多介绍,后续看到相关资料,再做补充。
最近在研究 Java 虚拟机字节码。在 《Java虚拟机规范》 看到一个整理完整的 Java 虚拟机指令集(也叫操作码)列表。转载过来,方便查阅。
关于 Java 虚拟机指令(操作码),准备写一个“探秘”系列:
Java 虚拟机操作码探秘:常量指令 — 重点介绍一下关于“常量”指令。
分类 操作码 助记符 指令含义 常量
0
0x00
nop
什么都不做
1
0x01
aconst_null
将 null 推送至栈顶
2
0x02
iconst_m1
将 int 类型 -1 推送至栈顶
3
0x03
iconst_0
将 int 类型 0 推送至栈顶
4
0x04
iconst_1
将 int 类型 1 推送至栈顶
5
0x05
iconst_2
将 int 类型 2 推送至栈顶
6
0x06
iconst_3
将 int 类型 3 推送至栈顶
7
0x07
iconst_4
将 int 类型 4 推送至栈顶
8
0x08
iconst_5
将 int 类型 5 推送至栈顶
9
0x09
lconst_0
将 long 类型 0 推送至栈顶
10
0x0a
lconst_1
将 long 类型 1 推送至栈顶
11
0x0b
fconst_0
将 float 类型 0 推送至栈顶
12
0x0c
fconst_1
将 float 类型 1 推送至栈顶
13
0x0d
fconst_2
将 float 类型 2 推送至栈顶
14
0x0e
dconst_0
将 double 类型 0 推送至栈顶
15
0x0f
dconst_1
将 double 类型 1 推送至栈顶
16
0x10
bipush
将单字节的常量值(-128 ~ 127)推送至栈顶
17
0x11
sipush
将一个短整类型常量值(-32,768 ~ 32,767)推送栈顶
18
0x12
ldc
将 int、 float 或 String 类型常量值从常量池中推送至栈顶
19
0x13
ldc_w
将int、 float 或 String 类型常量值从常量池中推送栈顶(宽索引)
20
0x14
ldc2_w
将 long 或 double 类型常量值从常量池中推送至栈(宽索引)
加载
21
0x15
iload
将指定的 int 类型本地变量推送至栈顶
22
0x16
lload
将指定的 long 类型本地变量推送至栈顶
23
0x17
fload
将指定的 float 类型本地变量推送至栈顶
24
0x18
dload
将指定的 double 类型本地变量推送至栈顶
25
0x19
aload
将指定的引用类型本地变量推送至栈顶
26
0x1a
iload_0
将第 1 个 int 类型本地变量推送至栈顶
27
0x1b
iload_1
将第 2 个 int 类型本地变量推送至栈顶
28
0x1c
iload_2
将第 3 个 int 类型本地变量推送至栈顶
29
0x1d
iload_3
将第 4 个 int 类型本地变量推送至栈顶
30
0x1e
lload_0
将第 1 个 long 类型本地变量推送至栈顶
31
0x1f
lload_1
将第 2 个 long 类型本地变量推送至栈顶
32
0x20
lload_2
将第 3 个 long 类型本地变量推送至栈顶
33
0x21
lload_3
将第 4 个 long 类型本地变量推送至栈顶
34
0x22
fload_0
将第 1 个 float 类型本地变量推送至栈顶
35
0x23
fload_1
将第 2 个 float 类型本地变量推送至栈顶
36
0x24
fload_2
将第 3 个 float 类型本地变量推送至栈顶
37
0x25
fload_3
将第 4 个 float 类型本地变量推送至栈顶
38
0x26
dload_0
将第 1 个 double 类型本地变量推送至栈顶
39
0x27
dload_1
将第 2 个 double 类型本地变量推送至栈顶
40
0x28
dload_2
将第 3 个 double 类型本地变量推送至栈顶
41
0x29
dload_3
将第 4 个 double 类型本地变量推送至栈顶
42
0x2a
aload_0
将第 1 个引用类型本地变量推送至栈顶
43
0x2b
aload_1
将第 2 个引用类型本地变量推送至栈顶
44
0x2c
aload_2
将第 3 个引用类型本地变量推送至栈顶
45
0x2d
aload_3
将第 4 个引用类型本地变量推送至栈顶
46
0x2e
iaload
将 int 类型数组的指定元素推送至栈顶
47
0x2f
laload
将 long 类型数组的指定元素推送至栈顶
48
0x30
faload
将 float 类型数组的指定元素推送至栈顶
49
0x31
daload
将 double 类型数组的指定元素推送至栈顶
50
0x32
aaload
将引用类型数组的指定元素推送至栈顶
51
0x33
baload
将 boolean 或 byte 类型数组的指定元素推送至栈顶
52
0x34
caload
将 char 类型数组的指定元素推送至栈顶
53
0x35
saload
将 short 类型数组的指定元素推送至栈顶
存储
54
0x36
istore
将栈顶 int 类型数值存入指定本地变量
55
0x37
lstore
将栈顶 long 类型数值存入指定本地变量
56
0x38
fstore
将栈顶 float 类型数值存入指定本地变量
57
0x39
dstore
将栈顶 double 类型数值存入指定本地变量
58
0x3a
astore
将栈顶引用类型数值存入指定本地变量
59
0x3b
istore_0
将栈顶 int 类型数值存入第 1 个本地变量
60
0x3c
istore_1
将栈顶 int 类型数值存入第 2 个本地变量
61
0x3d
istore_2
将栈顶 int 类型数值存入第 3 个本地变量
62
0x3e
istore_3
将栈顶 int 类型数值存入第 4 个本地变量
63
0x3f
lstore_0
将栈顶 long 类型数值存入第 1 个本地变量
64
0x40
lstore_1
将栈顶 long 类型数值存入第 2 个本地变量
65
0x41
lstore_2
将栈顶 long 类型数值存入第 3 个本地变量
66
0x42
lstore_3
将栈顶 long 类型数值存入第 4 个本地变量
67
0x43
fstore_0
将栈顶 float 类型数值存入第 1 个本地变量
68
0x44
fstore_1
将栈顶 float 类型数值存入第 2 个本地变量
69
0x45
fstore_2
将栈顶 float 类型数值存入第 3 个本地变量
70
0x46
fstore_3
将栈顶 float 类型数值存入第 4 个本地变量
71
0x47
dstore_0
将栈顶 double 类型数值存入第 1 个本地变量
72
0x48
dstore_1
将栈顶 double 类型数值存入第 2 个本地变量
73
0x49
dstore_2
将栈顶 double 类型数值存入第 3 个本地变量
74
0x4a
dstore_3
将栈顶 double 类型数值存入第 4 个本地变量
75
0x4b
astore_0
将栈顶引用类型数值存入第 1 个本地变量
76
0x4c
astore_1
将栈顶引用类型数值存入第 2 个本地变量
77
0x4d
astore_2
将栈顶引用类型数值存入第 3 个本地变量
78
0x4e
astore_3
将栈顶引用类型数值存入第 4 个本地变量
79
0x4f
iastore
将栈顶 int 类型数值存入指定数组的指定索引位置
80
0x50
lastore
将栈顶 long 类型数值存入指定数组的指定索引位置
81
0x51
fastore
将栈顶 float 类型数值存入指定数组的指定索引位置
82
0x52
dastore
将栈顶 double 类型数值存入指定数组的指定索引位置
83
0x53
aastore
将栈顶引用类型数值存入指定数组的指定索引位置
84
0x54
bastore
将栈顶 boolean 或 byte 类型数值存入指定数组的指定索引位置
85
0x55
castore
将栈顶 char 类型数值存入指定数组的指定索引位置
86
0x56
sastore
将栈顶 short 类型数值存入指定数组的指定索引位置
栈
87
0x57
pop
将栈顶数值弹出(数值不能是 long 或 double 类型的)
88
0x58
pop2
将栈顶的一个 long 或 double 类型的数值或两个其他类型的数值弹出
89
0x59
dup
复制栈顶数值并将复制值压入栈顶
90
0x5a
dup_x1
复制栈顶值并将其插入栈顶那两个值的下面
91
0x5b
dup_x2
复制栈顶值并将其插入栈顶那两个或三个值的下面
92
0x5c
dup2
复制栈顶的一个 long 或 double 类型的值,或两个其他类型的值,并将其压入栈顶
93
0x5d
dup2_x1
复制栈顶的一个或两个值,并将其插入栈顶那两个或三个值的下面
94
0x5e
dup2_x2
复制栈顶的一个或两个值,并将其插入栈顶那两个、三个或四个值的下面
95
0x5f
swap
将栈顶的两个数值互换(数值不能是 long 或 double 类型的)
数学
96
0x60
iadd
将栈顶两 int 类型数值相加并将结果压入栈顶
97
0x61
ladd
将栈顶两 1ong 类型数值相加并将结果压入栈顶
98
0x62
fadd
将栈顶两 float 类型数值相加并将结果压入栈顶
99
0x63
dadd
将栈顶两 double 类型数值相加并将结果压入栈顶
100
0x64
isub
将栈顶两 int 类型数值相减并将结果压入栈顶
101
0x65
lsub
将栈顶两 long 类型数值相减并将结果压入栈顶
102
0x66
fsub
将栈顶两 float 类型数值相减并将结果压入栈顶
103
0x67
dsub
将栈顶两 double 类型数值相减并将结果压入栈顶
104
0x68
imul
将栈顶两 int 类型数值相乘并将结果压入栈顶
105
0x69
lmul
将栈顶两 long 类型数值相乘并将结果压入栈顶
106
0x6a
fmul
将栈顶两 float 类型数值相乘并将结果压入栈顶
107
0x6b
dmul
将栈顶两 double 类型数值相乘并将结果压入栈顶
108
0x6с
idiv
将栈顶两 int 类型数值相除并将结果压入栈顶
109
0x6d
ldiv
将栈顶两 long 类型数值相除并将结果压入栈顶
110
0x6e
fdiv
将栈顶两 float 类型数值相除并将结果压入栈顶
111
0x6f
ddiv
将栈顶两 double 类型数值相除并将结果压入栈顶
112
0x70
irem
将栈顶两 int 类型数值作取模运算并将结果压入栈顶
113
0x71
lrem
将栈顶两 long 类型数值作取模运算并将结果压入栈顶
114
0x72
frem
将栈顶两 float 类型数值作取模运算并将结果压入栈顶
115
0x73
drem
将栈顶两 double 类型数值作取模运算并将结果压入栈顶
116
0x74
ineg
将栈顶 int 类型数值取负并将结果压入栈顶
117
0x75
lneg
将栈顶 long 类型数值取负并将结果压入栈顶
118
0x76
fneg
将栈顶 float 类型数值取负并将结果压入栈顶
119
0x77
dneg
将栈顶 double 类型数值取负并将结果压入栈顶
120
0x78
ishl
将 int 类型数值左移位指定位数并将结果压入栈顶
121
0x79
lshl
将 long 类型数值左移位指定位数并将结果压入栈顶
122
0x7a
ishr
将 int 类型数值(有符号)右移位指定位数并将结果压入栈顶
123
0x7b
lshr
将 long 类型数值(有符号)右移位指定位数并将结果压入栈顶
124
0x7c
iushr
将 int 类型数值(无符号)右移位指定位数并将结果压入栈顶
125
0x7d
lushr
将 long 类型数值(无符号)右移位指定位数并将结果压入栈顶
126
0x7e
iand
将栈顶两 int 类型数值作“按位与”并将结果压入栈顶
127
0x7f
land
将栈顶两 long 类型数值作“按位与”并将结果压入栈顶
128
0x80
ior
将栈顶两 int 类型数值作“按位或”并将结果压入栈顶
129
0x81
lor
将栈顶两 long 类型数值作“按位或”并将结果压入栈顶
130
0x82
ixor
将栈顶两 int 类型数值作“按位异或”并将结果压入栈顶
131
0x83
lxor
将栈顶两 long 类型数值作“按位异或”并将结果压入栈顶
132
0x84
iinc
将指定 int 类型变量增加指定值(i++,i--,i += 2)
转换
133
0x85
i2l
将栈顶 int 类型数值强制转换成 long 类型数值并将结果压入栈顶
134
0x86
i2f
将栈顶 int 类型数值强制转换成 float 类型数值并将结果压入栈顶
135
0x87
i2d
将栈顶 int 类型数值强制转换成 double 类型数值并将结果压入栈顶
136
0x88
l2i
将栈顶 long 类型数值强制转换成 int 类型数值并将结果压入栈顶
137
0x89
l2f
将栈顶 long 类型数值强制转换成 float 类型数值并将结果压入栈顶
138
0x8a
l2d
将栈顶 long 类型数值强制转换成 double 类型数值并将结果压入栈顶
139
0x8b
f2i
将栈顶 float 类型数值强制转换成 int 类型数值并将结果压入栈顶
140
0x8c
f2l
将栈顶 float 类型数值强制转换成 long 类型数值并将结果压入栈顶
141
0x8d
f2d
将栈顶 float 类型数值强制转换成 double 类型数值并将结果压入栈顶
142
0x8e
d2i
将栈顶 double 类型数值强制转换成 int 类型数值并将结果压入栈顶
143
0x8f
d2l
将栈顶 double 类型数值强制转换成 long 类型数值并将结果压入栈顶
144
0x90
d2f
将栈顶 double 类型数值强制转换成 float 类型数值并将结果压入栈顶
145
0x91
i2b
将栈顶 int 类型数值强制转换成 byte 类型数值并将结果压入栈顶
146
0x92
i2c
将栈顶 int 类型数值强制转换成 char 类型数值并将结果压入栈顶
147
0x93
i2s
将栈顶 int 类型数值强制转换成 short 类型数值并将结果压入栈顶
比较
148
0x94
lcmp
比较栈顶两 long 类型数值大小,并将结果(1,0,-1)压入栈顶
149
0x95
fcmpl
比较栈顶两 float 类型数值大小,并将结果(1,0,-1)压入栈顶;当其中一个数值为“NaN”时,将 -1 压入栈顶
150
0x96
fcmpg
比较栈顶两 float 类型数值大小,并将结果(1,0,-1)压入栈顶;当其中一个数值为“NaN”时,将1压入栈顶
151
0x97
dcmpl
比较栈顶两 double 类型数值大小,并将结果(1,0,-1)压入栈顶;当其中一个数值为“NaN”时,将-1压入栈顶
152
0x98
dcmpg
比较栈顶两 double 类型数值大小,并将结果(1,0,-1)压入栈顶;当其中一个数值为“NaN”时,将1压入栈顶
153
0x99
ifeq
当栈顶 int 类型数值等于 0 时跳转
154
0x9a
ifne
当栈顶 int 类型数值不等于 0 时跳转
155
0x9b
iflt
当栈顶 int 类型数值小于 0 时跳转
156
0x9c
ifge
当栈顶 int 类型数值大于等于 0 时跳转
157
0x9d
ifgt
当栈顶 int 类型数值大于 0 时跳转
158
0x9e
ifle
当栈顶 int 类型数值小于等于 0 时跳转
159
0x9f
if_icmpeq
比较栈顶两 int 类型数值大小,当前者等于后者时跳转
160
0xa0
if_icmpne
比较栈顶两 int 类型数值大小,当前者不等于后者时跳转
161
0xa1
if_icmplt
比较栈顶两 int 类型数值大小,当前者小于后者时跳转
162
0xa2
if_icmpge
比较栈顶两 int 类型数值大小,当前者大于等于后者时跳转
163
0xa3
if_icmpgt
比较栈顶两 int 类型数值大小,当前者大于后者时跳转
164
0xa4
if_icmple
比较栈顶两 int 类型数值大小,当前者小于等于后者时跳转
165
0xa5
if_acmpeq
比较栈顶两引用类型数值,当结果相等时跳转
166
0xa6
ifacmpne
比较栈顶两引用类型数值,当结果不相等时跳转
控制
167
0xa7
goto
无条件跳转
168
0xa8
jsr
跳转至指定 16 位 offset 位置,并将 jsr 下一条指令地址压入栈顶
169
0xa9
ret
返回至由指定的局部变量所给出的指令位置(一般与 jsr、jsr_w 联合使用)
170
0xaa
tableswitch
用于 switch 条件跳转,case 值连续(变长指令)
171
0xab
lookupswitch
用于 switch 条件跳转,case 值不连续(变长指令)
172
0xac
ireturn
从当前方法返回 int
173
Oxad
lreturn
从当前方法返回 long
174
0xae
freturn
从当前方法返回 float
175
0xaf
dreturn
从当前方法返回 double
176
0xb0
areturn
从当前方法返回对象引用
177
0xb1
return
从当前方法返回void
引用
178
0xb2
getstatic
获取指定类的静态字段,并将其值压入栈顶
179
0xb3
putstatic
为指定类的静态字段赋值
180
0xb4
getfield
获取指定类的实例字段,并将其值压入栈顶
181
0xb5
putfield
为指定类的实例字段赋值
182
0xb6
invokevirtual
调用实例方法
183
0xb7
invokespecial
调用父类方法、实例初始化方法、私有方法
184
0xb8
invokestatic
调用静态方法
185
0xb9
invokeinterface
调用接口方法
186
0xba
invokedynamic
调用动态链接方法
187
0xbb
new
创建一个对象,并将其引用值压入栈顶
188
0xbc
newarray
创建一个指定原始类型(如int、float 、char等)的数组,并将其引用值压入栈顶
189
0xbd
anewarray
创建一个引用型(如类、接口、数组)的数组,并将其引用值压入栈顶
190
0xbe
arraylength
获得数组的长度值并压入栈顶
191
0xbf
athrow
将栈顶的异常抛出
192
0xcO
checkcast
检验类型转换,检验未通过将抛出 ClassCastException
193
0xc1
instanceof
检验对象是否是指定类的实例。如果是,就将 1 压入栈顶,否则将 0 压入栈顶
194
0xc2
monitorenter
获得对象的锁,用于实现同步块
195
0xc3
monitorexit
释放对象的锁,用于实现同步块
扩展
196
0xc4
wide
扩展本地变量索引的宽度
197
0xс5
multianewarray
创建指定类型和指定维度的多维数组(执行该指令时,操作栈中必须包含各维度的长度值),并将其引用值压入栈顶
198
0xc6
ifnull
为nu11时跳转
199
0xc7
ifnonnull
不为nu11时跳转
200
0xc8
goto_w
无条件跳转(宽索引)
201
0xc9
jsr_w
跳转至指定 32 位 offset 位置,并将 jsr_w 下一条指令地址压入栈顶
保留指令
202
Оxca
breakpoint
调试时的断点标记
254
Oxfe
impdep1
为特定软件面预留的语言后门
255
0xff
impdep2
为特定硬件面预留的语言后门
参考资料 Chapter 6. The Java Virtual Machine Instruction Set
Java bytecode
List of Java bytecode instructions