9.JVM之深入理解堆
今年花胜去年红。可惜明年花更好,知与谁同?
——欧阳修《浪淘沙》
JVM之深入理解堆
1. 堆的核心概念
堆针对一个JVM进程来说是唯一的,也就是一个进程只有一个JVM,但是进程包含多个线程,他们是共享同一堆空间的。
一个JVM实例只存在一个堆内存,
堆也是Java内存管理的核心区域。
Java堆区在JVM启动的时候即被创建,其空间大小也就确定了。是JVM管理的最大一块内存空间。
堆内存的大小是可以调节的。
~~~java
// 如果设置最小堆内存和最大堆内存,建议设置成相同值
-Xms10m:最小堆内存-Xmx10m:最大堆内存
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
3. `《Java虚拟机规范》规定,堆可以处于物理上不连续的内存空间中,但在逻辑上它应该被视为连续的。`
4. 所有的线程共享Java堆,在这里`还可以划分线程私有的缓冲区(Thread Local Allocation Buffer,TLAB)。`
5. 下图就是使用:`Java VisualVM查看堆空间的内容。`
![image-20200916205947671](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200916205947671.png)
1. 《Java虚拟机规范》中对Java堆的描述是:`所有的对象实例以及数组都应当在运行时分配在堆上。`
2. `我要说的是:“几乎”所有的对象实例都在这里分配内存。—从实际使用角度看的。`
- 因为还有一些对象是在栈上分配的。
3. 数组和对象可能永远不会存储在栈上,因为栈帧中保存引用,这个引用指向对象或者数组在堆中的位置。
4. 在方法结束后,堆中的对象不会马上被移除,仅仅在垃圾收集的时候才会被移除。
- `也就是触发了GC的时候,才会进行回收。`
- `如果堆中对象马上被回收,那么用户线程就会收到影响,因为有stop the word。`
5. `堆,是GC(Garbage Collection,垃圾收集器)执行垃圾回收的重点区域。`
![image-20200706201904057](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200706201904057.png)
### 2. 堆内存细分
现代垃圾收集器大部分都基于`分代收集理论`设计,堆空间细分为:
1. Java 7 及之前堆内存逻辑上分为三部分:`新生代 + 老年代 + 永久代`
- Young Generation Space 新生代 Young/New
- 又被划分为Eden区和Survivor区
- Tenure generation space 老年代 Old/Tenure
- Permanent Space 永久代 Perm
- ![image-20200706203419496](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200706203419496.png)
2. Java 8及之后堆内存逻辑上分为三部分:`新生代 + 老年代 + 元空间`
- Young Generation Space 新生代 Young/New
- 又被划分为Eden区和Survivor区
- Tenure generation space 老年代 Old/Tenure
- Meta Space 元空间 Meta
- `堆空间内部结构,JDK1.8 之前从永久代 替换成 元空间`
- ![image-20200706203835403](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200706203835403.png)
### 3. 设置堆内存大小与OOM
#### 3.1 设置堆内存大小
1. Java堆区用于存储Java对象实例,那么`堆的大小在JVM启动时就已经设定好了`,大家可以`通过选项"-Xmx"和"-Xms"来进行设置。`
- `“-Xms"用于表示堆区的起始内存,等价于-xx:InitialHeapSize`
- `“-Xmx"则用于表示堆区的最大内存,等价于-XX:MaxHeapSize`
2. `一旦堆区中的内存大小超过“-Xmx"所指定的最大内存时,将会抛出OutOfMemoryError异常。`
3. 通常会将`-Xms`和`-Xmx`两个参数配置相同的值,其目的是为了能够在Java垃圾回收机制清理完堆区后不需要重新分隔计算堆区的大小,从而提高性能。
4. 默认情况下:
- `初始内存大小:物理电脑内存大小/64;`
- `最大内存大小:物理电脑内存大小/4;`
5. `手动设置:-Xms600m -Xmx600m`
>- `开发中建议将初始堆内存和最大的堆内存设置成相同的值。`
```java
/**
* -Xms 用来设置堆空间(年轻代+老年代)的初始内存大小
* -X:是jvm运行参数
* ms:memory start
* -Xmx:用来设置堆空间(年轻代+老年代)的最大内存大小
*/
public class HeapSpaceInitial {
public static void main(String[] args) {
// 返回Java虚拟机中的堆内存总量
long initialMemory = Runtime.getRuntime().totalMemory() / 1024 / 1024;
// 返回Java虚拟机试图使用的最大堆内存
long maxMemory = Runtime.getRuntime().maxMemory() / 1024 / 1024;
System.out.println("-Xms:" + initialMemory + "M");
System.out.println("-Xmx:" + maxMemory + "M");
}
}
```
输出结果
```
-Xms : 243M
-Xmx : 3607M
```
如何查看堆内存的内存分配情况?
```shell
方法一:
jps 查看程序的进程号
staat -gc 进程id 查看堆内存的内存分配情况
```
![image-20200916230017805](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200916230017805.png)
```jvm
方式二:
-XX:+PrintGCDetails
```
![image-20200918193400055](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200918193400055.png)
#### 3.2 OutOfMemory举例
```java
public class OOMTest {
public static void main(String[] args) {
ArrayList<Picture> list = new ArrayList<>();
while(true){
try {
Thread.sleep(20);
} catch (InterruptedException e) {
e.printStackTrace();
}
list.add(new Picture(new Random().nextInt(1024 * 1024)));
}
}
}
class Picture{
private byte[] pixels;
public Picture(int length) {
this.pixels = new byte[length];
}
}
```
![image-20200918193805887](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200918193805887.png)
我们用上面这个个OOM例子,然后设置启动参数
```
-Xms600m -Xmx:600m
```
运行后,就出现OOM了,那么我们可以通过 `VisualVM这个工具`查看具体是什么参数造成的OOM。
![image-20200918194337345](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200918194337345.png)
### 4. 年轻代与老年代
1. 存储在JVM中的`Java对象可以被划分为两类:`
- 一类是生命周期较短的瞬时对象,这类对象的创建和消亡都非常迅速。
- 生命周期短的,及时回收即可
- 另外一类对象的生命周期却非常长,在某些极端的情况下还能够与JVM的生命周期保持一致。
2. Java堆区进一步细分的话,可以划分为`年轻代(YoungGen)和老年代(oldGen)`
3. 其中`年轻代又可以划分为Eden空间、Survivor0空间和Survivor1空间(有时也叫做from区、to区)`
- 默认比例
- `Eden:From:to -> 8:1:1`
- `新生代:老年代 - > 1 : 2`
![image-20200707075847954](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707075847954.png)
`下面这参数开发中一般不会调:`
![image-20200707080154039](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707080154039.png)
1. 配置新生代与老年代在堆结构的占比。
- `默认-XX:NewRatio=2`,表示新生代占1,老年代占2,新生代占整个堆的1/3
- 可以修改-XX:NewRatio=4,表示新生代占1,老年代占4,新生代占整个堆的1/5
2. `当发现在整个项目中,生命周期长的对象偏多,那么就可以通过调整 老年代的大小,来进行调优。`
3. 在HotSpot中,`Eden空间和另外两个survivor空间缺省所占的比例是8:1:1`
- 当然开发人员可以通过选项“`-XX:SurvivorRatio`”调整这个空间比例。比如`-xx:SurvivorRatio=8`
4. `几乎所有的Java对象都是在Eden区被new出来的。`绝大部分的Java对象的销毁都在新生代进行了。`(有些大的对象在Eden区无法存储时候,将直接进入老年代)`
- `IBM公司的专门研究表明,新生代中80%的对象都是“朝生夕死”的。`
5. `可以使用选项`"-Xmn"设置新生代最大内存大小,这个参数一般使用默认值就可以了。
![image-20200707084208115](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707084208115.png)
### 5. 图解对象分配过程
#### 5.1 分配过程概述
为新对象分配内存是一件非常严谨和复杂的任务,JVM的设计者们不仅需要考虑内存如何分配、在哪里分配等问题,并且由于内存分配算法与内存回收算法密切相关,所以还需要考虑GC执行完内存回收后是否会在内存空间中产生内存碎片。
1. new的对象先放伊甸园区。此区有大小限制。
2. 当伊甸园的空间填满时,程序又需要创建对象,JVM的垃圾回收器将对伊甸园区进行垃圾回收(`MinorGC`),将伊甸园区中的不再被其他对象所引用的对象进行销毁。再加载新的对象放到伊甸园区
3. 然后将伊甸园中的剩余对象移动到幸存者S0区。
4. 如果再次触发垃圾回收,此时上次幸存下来的放到幸存者S0区的,如果没有回收,就会放到幸存者S1区。
5. 如果再次经历垃圾回收,此时会重新放回幸存者S0区,接着再去幸存者S1区。
6. `啥时候能去老年代呢?可以设置次数。默认是15次。`
- 可以设置参数:`-XX:MaxTenuringThreshold=N`进行设置。
7. 在老年代,相对悠闲。当老年代内存不足时,再次触发GC:`Major GC`,进行老年代的内存清理。
8. 若老年代执行了Major GC之后,发现依然无法进行对象的保存,就会产生OOM异常。
#### 5.2 图解过程
1. 我们创建的对象,一般都是存放在Eden区的,当我们Eden区满了后,就会触发GC操作,`一般被称为 YGC / Minor GC操作`
2. ![image-20200707084714886](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707084714886.png)
3. 当我们进行一次垃圾收集后,红色的将会被回收,而绿色的还会被占用着,存放在S0(Survivor From)区。`同时我们给每个对象设置了一个年龄计数器,一次回收后就是1。`
4. 同时Eden区继续存放对象,当Eden区再次存满的时候,又会触发一个MinorGC操作,此时GC将会把 Eden和Survivor From中的对象 进行一次收集,`把存活的对象放到 Survivor To区,同时让年龄 + 1`
5. ![image-20200707085232646](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707085232646.png)
6. `我们继续不断的进行对象生成 和 垃圾回收,当Survivor中的对象的年龄达到15的时候,将会触发一次 Promotion晋升的操作,也就是将年轻代中的对象 晋升到 老年代中。`
7. ![image-20200707085737207](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707085737207.png)
##### 幸存区区满了后?
1. 特别注意,在Eden区满了的时候,才会触发MinorGC,而幸存者区满了后,不会触发MinorGC操作。
2. 如果Survivor区满了后,将会触发`一些特殊的规则`,也就是可能直接晋升老年代
- 举例:以当兵为例,正常人的晋升可能是 : 新兵 -> 班长 -> 排长 -> 连长
- 但是也有可能有些人因为做了非常大的贡献,直接从 新兵 -> 排长
#### 5.3 对象分配的特殊情况
![image-20200707091058346](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707091058346.png)
##### 代码演示对象分配过程
1. 我们不断的创建大对象
```java
/**
* 代码演示对象创建过程
*/
public class HeapInstanceTest {
byte[] buffer = new byte[new Random().nextInt(1024 * 200)];
public static void main(String[] args) {
ArrayList<HeapInstanceTest> list = new ArrayList<HeapInstanceTest>();
while (true) {
list.add(new HeapInstanceTest());
try {
Thread.sleep(10);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
```
2. 然后设置JVM参数
```bash
-Xms600m -Xmx600m
```
3. 然后cmd输入下面命令,打开VisualVM图形化界面
```
jvisualvm
```
4. 然后通过执行上面代码,通过VisualGC进行动态化查看
![jvmdui](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/jvmdui.gif)
最终,在老年代和新生代都满了,就出现OOM
```java
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
at com.atguigu.java1.HeapInstanceTest.<init>(HeapInstanceTest.java:10)
at com.atguigu.java1.HeapInstanceTest.main(HeapInstanceTest.java:15)
```
#### 5.4 常用的调优工具
1. JDK命令行
2. Eclipse:Memory Analyzer Tool
3. Jconsole
4. `Visual VM(实时监控 推荐~)`
5. Jprofiler(推荐~)
6. Java Flight Recorder(实时监控)
7. GCViewer
8. GCEasy
#### 5.5 总结
1. 针对幸存者s0,s1区的总结:复制之后有交换,谁空谁是to。
2. 关于垃圾回收:频繁在新生区收集,很少在老年代收集,几乎不再永久代和元空间进行收集。
3. `新生代采用复制算法的目的:是为了减少内碎片。`
### 6. Minor GC,MajorGC、Full GC
`我们都知道,JVM的调优的一个环节,也就是垃圾收集,我们需要尽量的避免垃圾回收,因为在垃圾回收的过程中,容易出现STW的问题。而 Major GC 和 Full GC出现STW的时间,是Minor GC的10倍以上`
JVM在进行GC时,并非每次都对上面三个内存区域一起回收的,大部分时候回收的都是指新生代。`针对Hotspot VM的实现,它里面的GC按照回收区域又分为两大种类型:一种是部分收集(Partial GC),一种是整堆收集(FullGC)`
1. 部分收集:不是完整收集整个Java堆的垃圾收集。其中又分为:
- 新生代收集(MinorGC/YoungGC):只是新生代的垃圾收集
- 老年代收集(MajorGC/OldGC):只是老年代的圾收集。
- 目前,只有CMSGC会有单独收集老年代的行为。
- 注意,很多时候Major GC会和Full GC混淆使用,需要具体分辨是老年代回收还是整堆回收。
- 混合收集(MixedGC):收集整个新生代以及部分老年代的垃圾收集。目前,只有G1 GC会有这种行为。
2. 整堆收集(FullGC):收集整个java堆和方法区的垃圾收集。
#### 6.1 Minor GC
1. 当年轻代空间不足时,就会触发Minor GC,这里的年轻代满指的是Eden代满,`Survivor满不会引发GC`。(每次Minor GC会清理年轻代的内存。)
2. 因为Java对象大多都具备 `朝生夕灭` 的特性,所以Minor GC非常频繁,一般回收速度也比较快。这一定义既清晰又易于理解。
3. Minor GC会引发STW(stop the word),暂停其它用户的线程,等垃圾回收结束,用户线程才恢复运行。
- ![image-20200707095606813](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707095606813.png)
#### 6.2 Major GC
1. 指发生在老年代的GC,对象从老年代消失时,我们说 “Major GC” 或 “Full GC” 发生了。
2. 出现了Major GC,经常会伴随至少一次的Minor GC(但非绝对的,在Paralle1 Scavenge收集器的收集策略里就有直接进行Major GC的策略选择过程)。
- 也就是在老年代空间不足时,会先尝试触发Minor GC。如果之后空间还不足,则触发Major GC。
3. Major GC的速度一般会比Minor GC慢10倍以上,STW的时间更长。
4. 如果Major GC后,内存还不足,就报OOM了。
#### 6.3 Full GC
`触发Full GC执行的情况有如下五种:`
1. 调用System.gc()时,系统建议执行Full GC,但是不必然执行。
2. 老年代空间不足。
3. 方法区空间不足。
4. 通过Minor GC后进入老年代的平均大小大于老年代的可用内存。
5. `由Eden区、survivor space0(From Space)区向survivor space1(To Space)区复制时,对象大小大于To Space可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小。`
说明:`Full GC 是开发或调优中尽量要避免的。这样暂时时间会短一些`
#### 6.4 GC 举例
1. 我们编写一个OOM的异常,因为我们在不断的创建字符串,是存放在元空间的。
```java
/**
* GC测试MinorGC 、 MajorGC、FullGC
* -Xms9m -Xmx9m -XX:+PrintGCDetails
*/
public class GCTest {
public static void main(String[] args) {
int i = 0;
try {
List<String> list = new ArrayList<>();
String a = "atguigu.com";
while (true) {
list.add(a);
a = a + a;
i++;
}
} catch (Throwable t) {
t.printStackTrace();
System.out.println("遍历次数为:" + i);
}
}
}
```
2. `设置JVM启动参数`
```bash
-Xms9m -Xmx9m -XX:+PrintGCDetails
```
3. 打印出的日志
4. ![GC日志](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/GC日志.png)
5. `触发OOM的时候,一定是进行了一次Full GC,因为只有在老年代空间不足时候,才会爆出OOM异常。`
### 7. 堆空间分代思想
#### 为什么要把Java堆分代?不分代就不能正常工作了吗?
经研究,不同对象的生命周期不同。70%-99%的对象是临时对象。
1. 新生代:有Eden、两块大小相同的survivor(又称为from/to,s0/s1)构成,to总为空。
2. 老年代:存放新生代中经历多次GC仍然存活的对象。
![image-20200707101511025](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707101511025.png)
#### 为什么需要把Java堆分代?不分代就不能正常工作了吗?
其实不分代完全可以,`分代的唯一理由就是优化GC性能`。如果没有分代,那所有的对象都在一块,就如同把一个学校的人都关在一个教室。GC的时候要找到哪些对象没用,这样就会对堆的所有区域进行扫描。而很多对象都是朝生夕死的,如果分代的话,把新创建的对象放到某一地方,当GC的时候先把这块存储“朝生夕死”对象的区域进行回收,这样就会腾出很大的空间出来。
![image-20200707101543871](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707101543871.png)
### 8. 内存分配策略(对象的提升策略)
1. 如果对象在Eden出生并经过第一次Minor GC后仍然存活,并且能被 Survivor 容纳的话,将被移动到survivor空间中,并将对象年龄设为1。对象在survivor区中每熬过一次Minor GC,年龄就增加1岁,当它的年龄增加到一定程度(默认为15岁,其实每个JVM、每个GC都有所不同)时,就会被晋升到老年代中。
2. `对象晋升老年代的年龄阀值,可以通过选项-xx:MaxTenuringThreshold来设置。`
3. 针对不同年龄段的对象分配原则如下所示:
- 优先分配到Eden
- 大对象直接分配到老年代
- 开发中比较长的字符串或者数组,会直接存在老年代,但是因为新创建的对象 都是 朝生夕死的,所以这个大对象可能也很快被回收,但是因为老年代触发Major GC的次数比 Minor GC要更少,因此可能回收起来就会比较慢。
- `尽量避免程序中出现过多的大对象!`
- 长期存活的对象分配到老年代
- 动态对象年龄判断
- `如果survivor区中相同年龄的所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象可以直接进入老年代,无须等到MaxTenuringThreshold 中要求的年龄。`
- `空间分配担保: -Xx:HandlePromotionFailure`
- 也就是经过Minor GC后,所有的对象都存活,因为Survivor比较小,所以就需要将Survivor无法容纳的对象,存放到老年代中。
### 9. 为对象分配内存—TLAB
#### 9.1 堆空间都是共享的么?
`不一定,因为还有TLAB这个概念,在堆中划分出一块区域,为每个线程所独占。`
#### 9.2 为什么有TLAB?
1. `TLAB:Thread Local Allocation Buffer`,也就是为每个线程单独分配了一个缓冲区。
2. `堆区是线程共享区域,任何线程都可以访问到堆区中的共享数据。`
3. 由于对象实例的创建在JVM中非常频繁,因此在并发环境下从堆区中划分内存空间是线程不安全的。
4. 为避免多个线程操作同一地址,需要使用加锁等机制,进而影响分配速度。
#### 9.3 什么是TLAB
1. 从内存模型而不是垃圾收集的角度,对Eden区域继续进行划分,`JVM为每个线程分配了一个私有缓存区域,它包含在Eden空间内。`
2. 多线程同时分配内存时,使用TLAB可以避免一系列的非线程安全问题,同时还能够提升内存分配的吞吐量,因此我们可以将这种内存分配方式称之为`快速分配策略`。
3. 据宋老师所知所有OpenJDK衍生出来的JVM都提供了TLAB的设计。
4. 尽管不是所有的对象实例都能够在TLAB中成功分配内存,但JVM确实是将TLAB作为内存分配的首选。
5. 在程序中,开发人员可以通过选项“-Xx:UseTLAB”设置是否开启TLAB空间,默认是开启的。
6. 默认情况下,TLAB空间的内存非常小,`仅占有整个Eden空间的1%`,当然我们可以`通过选项“-XX:TLABWasteTargetPercent”设置TLAB空间所占用Eden空间的百分比大小`。
7. 一旦对象在TLAB空间分配内存失败时,JVM就会尝试着通过使用加锁机制确保数据操作的原子性,从而直接在Eden空间中分配内存。
![image-20200707103547712](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707103547712.png)
#### 9.4 TLAB分配过程
对象首先是通过TLAB开辟空间,如果不能放入,那么需要通过Eden来进行分配
![image-20200707104253530](https://oss-blogs.oss-cn-hangzhou.aliyuncs.com/blogs/itbuild/JavaSE-JVM/image-20200707104253530.png)
### 10. 小结--堆空间的参数设置
1. `-XX:+PrintFlagsInitial`:查看所有的参数的默认初始值。
2. `-XX:+PrintFlagsFinal`:查看所有的参数的最终值(可能会存在修改,不再是初始值)。
3. `-Xms`:初始堆空间内存(默认为物理内存的1/64)。
4. `-Xmx`:最大堆空间内存(默认为物理内存的1/4)。
5. `-Xmn`:设置新生代的大小。(初始值及最大值)。
6. `-XX:NewRatio`:配置新生代与老年代在堆结构的占比。
7. `-XX:SurvivorRatio`:设置新生代中Eden和S0/S1空间的比例。
8. `-XX:MaxTenuringThreshold`:设置新生代垃圾的最大年龄。
9. `-XX:+PrintGCDetails`:输出详细的GC处理日志。
- 打印gc简要信息:
1. `-Xx:+PrintGC`
2. `- verbose:gc`
10. `-XX:HandlePromotionFalilure`:是否设置空间分配担保。
#### 10.1 空间分配担保
`在发生Minor GC之前,虚拟机会检查老年代最大可用的连续空间是否大于新生代所有对象的总空间。`
- 如果大于,则此次Minor GC是安全的。
- 如果小于,则虚拟机会查看`-XX:HandlePromotionFailure`设置值`是否允许担保失败`。
- 如果`-XX:HandlePromotionFailure=true`,那么会继续检查`老年代最大可用连续空间是否大于历次晋升到老年代的对象的平均大小`。
- 如果大于,则尝试进行一次Minor GC,但这次Minor GC依然是有风险的;
- 如果小于,则改为进行一次Full GC。
- 如果`-XX:HandlePromotionFailure=false`,则改为进行一次Full GC。
在JDK6 Update24之后 ,HandlePromotionFailure参数不会再影响到虚拟机的空间分配担保策略,观察openJDK中的源码变化,虽然源码中还定义了HandlePromotionFailure参数,但是在代码中已经不会再使用它。`JDK6 Update 24之后的规则变为只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小就会进行Minor GC,否则将进行Full GC。`
### 11. 堆是分配对象的唯一选择么?
在《`深入理解Java虚拟机`》中关于Java堆内存有这样一段描述:`随着JIT编译期的发展与逃逸分析技术逐渐成熟`,`栈上分配`、`标量替换`优化技术将会导致一些微妙的变化,`所有的对象都分配到堆上也渐渐变得不那么“绝对”了。`
在Java虚拟机中,对象是在Java堆中分配内存的,这是一个普遍的常识。但是,有一种特殊情况,那就是`如果经过逃逸分析(Escape Analysis)后发现,一个对象并没有逃逸出方法的话,那么就可能被优化成栈上分配。`这样就无需在堆上分配内存,也无须进行垃圾回收了。这也是最常见的`堆外存储技术`。
- 此外,前面提到的`基于OpenJDk深度定制的TaoBaoVM`,其中创新的`GCIH(GC invisible heap)`技术实现`off-heap`,`将生命周期较长的Java对象从heap中移至heap外`,并且GC不能管理GCIH内部的Java对象,以此达到降低GC的回收频率和提升GC的回收效率的目的。
#### 11.1 逃逸分析概述
1. 如何将堆上的对象分配到栈,需要使用逃逸分析手段。
2. 这是`一种可以有效减少Java程序中同步负载`和`内存堆分配压力的跨函数全局数据流分析算法`。通过逃逸分析,Java Hotspot编译器能够分析出一个新的对象的引用的使用范围从而决定`是否要将这个对象分配到堆上`。逃逸分析的基本行为就是`分析对象动态作用域`:
- `当一个对象在方法中被定义后,对象只在方法内部使用,则认为没有发生逃逸。`
- 当一个对象在方法中被定义后,它被外部方法所引用,则认为发生逃逸。例如作为调用参数传递到其他地方中。
3. 逃逸分析举例:
- 没有发生逃逸的对象,则可以分配到栈上,随着方法执行的结束,栈空间就被移除,每个栈里面包含了很多栈帧,也就是发生逃逸分析。
- ~~~~java
public void my_method() {
V v = new V();
// use v
// ....
v = null;
}
~~~~
- `针对下面的代码`
- ~~~~java
public static StringBuffer createStringBuffer(String s1, String s2) {
StringBuffer sb = new StringBuffer();
sb.append(s1);
sb.append(s2);
return sb;
}
~~~~
- `如果想要StringBuffer sb不发生逃逸,可以这样写`
- ~~~java
public static String createStringBuffer(String s1, String s2) {
StringBuffer sb = new StringBuffer();
sb.append(s1);
sb.append(s2);
return sb.toString();
}
逃逸分析代码举例
1 | /** |
逃逸分析参数设置
在JDK 1.7 版本之后,HotSpot中默认就已经开启了逃逸分析。如果使用的是较早的版本,开发人员则可以通过:
- 选项“
-XX:+DoEscapeAnalysis
“显式开启逃逸分析。- 通过选项“
-XX:+PrintEscapeAnalysis
“查看逃逸分析的筛选结果。
逃逸分析的结论
开发中能使用局部变量的,就不要使用在方法外定义。
使用逃逸分析,编译器可以对代码做如下优化:
栈上分配:
将堆分配转化为栈分配。如果一个对象在子程序中被分配,要使指向该对象的指针永远不会发生逃逸,对象可能是栈上分配的候选,而不是堆上分配。同步省略:
如果一个对象被发现只有一个线程被访问到,那么对于这个对象的操作可以不考虑同步。分离对象或标量替换:
有的对象可能不需要作为一个连续的内存结构存在也可以被访问到,那么对象的部分(或全部)可以不存储在内存,而是存储在CPU寄存器中。
11.2 栈上分配
JIT编译器在编译期间根据逃逸分析的结果,发现如果一个对象并没有逃逸出方法的话,就可能被优化成栈上分配。分配完成后,继续在调用栈内执行,最后线程结束,栈空间被回收,局部变量对象也被回收。这样就无须进行垃圾回收了。
- 在逃逸分析中,已经说明了。分别是给成员变量赋值、方法返回值、实例引用传递。
栈上分配举例
- 我们通过举例来
说明 开启逃逸分析 和 未开启逃逸分析时候的情况。
1 | /** |
- 设置JVM参数,表示
未开启逃逸分析
。
1 | -Xmx1G -Xms1G -XX:-DoEscapeAnalysis -XX:+PrintGCDetails |
- 运行结果,同时还触发了GC操作
1 | 花费的时间为:116 ms |
- 然后查看内存的情况,发现有大量的User存储在堆中。
- 我们在开启逃逸分析。
1 | -Xmx1G -Xms1G -XX:+DoEscapeAnalysis -XX:+PrintGCDetails |
然后查看运行时间,我们能够发现花费的时间快速减少,同时不会发生GC操作。
1 | 花费的时间为:8 ms |
- 然后在看内存情况,我们发现只有很少的User对象,说明User发生了逃逸,因为他们存储在栈中,随着栈的销毁而消失。
11.3 同步省略
线程同步的代价是相当高的,同步的后果是降低并发性和性能。
在动态编译同步块的时候,JIT编译器可以借助逃逸分析来判断同步块所使用的锁对象是否只能够被一个线程访问而没有被发布到其他线程。如果没有,那么JIT编译器在编译这个同步块的时候就会取消对这部分代码的同步。这样就能大大提高并发性和性能。这个取消同步的过程就叫同步省略,也叫锁消除。☆
1 | // 例如下面的代码 |
我们将其转换成字节码
11.4 分离对象和标量替换
标量(scalar)是指一个无法再分解成更小的数据的数据。Java中的原始数据类型就是标量。
相对的,那些
还可以分解的数据叫做聚合量(Aggregate)
,Java中的对象就是聚合量,因为他可以分解成其他聚合量和标量。
在JIT阶段,如果经过逃逸分析,发现一个对象不会被外界访问的话,那么经过JIT优化,就会把这个对象拆解成若干个其中包含的若干个成员变量来代替。这个过程就是标量替换。
1 | public static void main(String args[]) { |
以上代码,经过标量替换后,就会变成
1 | private static void alloc() { |
- 可以看到,Point这个聚合量经过逃逸分析后,发现他并没有逃逸,就被替换成两个聚合量了。
那么标量替换有什么好处呢?就是可以大大减少堆内存的占用。因为一旦不需要创建对象了,那么就不再需要分配堆内存了。
- 标量替换为栈上分配提供了很好的基础。
代码优化之标量替换
上述代码在主函数中进行了1亿次alloc。调用进行对象创建,由于User对象实例需要占据约16字节的空间,因此累计分配空间达到将近1.5GB。如果堆空间小于这个值,就必然会发生GC。使用如下参数运行上述代码:
1 -server -Xmx100m -Xms100m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:+EliminateAllocations这里设置参数如下:
- 参数
-server
:启动Server模式,因为在server模式下,才可以启用逃逸分析。- 参数
-XX:+DoEscapeAnalysis
:启用逃逸分析。- 参数
-Xmx10m
:指定了堆空间最大为10MB。- 参数
-XX:+PrintGC
:将打印Gc日志。- 参数
-xx:+EliminateAllocations
:开启了标量替换(默认打开),允许将对象打散分配在栈上,比如对象拥有id和name两个字段,那么这两个字段将会被视为两个独立的局部变量进行分配
11.5 逃逸分析的不足
关于逃逸分析的论文在1999年就已经发表了,但直到JDK1.6才有实现,
而且这项技术到如今也并不是十分成熟的。
其根本原因就是无法保证逃逸分析的性能消耗一定能高于他的消耗。虽然经过逃逸分析可以做标量替换、栈上分配、和锁消除。但是逃逸分析自身也是需要进行一系列复杂的分析的,这其实也是一个相对耗时的过程。
- 一个极端的例子,就是经过逃逸分析之后,发现没有一个对象是不逃逸的。那这个逃逸分析的过程就白白浪费掉了。
虽然这项技术并不十分成熟,但是它也是即时编译器优化技术中一个十分重要的手段。注意到有一些观点,认为通过逃逸分析,JVM会在栈上分配那些不会逃逸的对象,这在理论上是可行的,但是取决于JvM设计者的选择。
据我所知,Oracle Hotspot JVM中并未这么做,这一点在逃逸分析相关的文档里已经说明,所以可以明确所有的对象实例都是创建在堆上。
目前很多书籍还是基于JDK7以前的版本,JDK已经发生了很大变化,
intern字符串的缓存和静态变量曾经都被分配在永久代上,而永久代已经被元数据区取代。
但是,intern字符串缓存和静态变量并不是被转移到元数据区,而是直接在堆上分配
,所以这一点同样符合前面一点的结论:对象实例都是分配在堆上。
12. 堆小结
年轻代
是对象的诞生、成长、消亡的区域,一个对象在这里产生、应用,最后被垃圾回收器收集、结束生命。老年代
放置长生命周期的对象,通常都是从survivor区域筛选拷贝过来的Java对象。
- 当然,也有特殊情况,我们知道普通的对象会被分配在TLAB上;
- 如果对象较大,JVM会试图直接分配在Eden其他位置上;如果对象太大,完全无法在新生代找到足够长的连续空闲空间,JVM就会直接分配到老年代。
- 当GC只发生在年轻代中,回收年轻代对象的行为被称为Minor GC。
当GC发生在老年代时则被称为Major GC或者Full GC。一般的,Minor GC的发生频率要比Major GC高很多,即老年代中垃圾回收发生的频率将大大低于年轻代。