- 《码出高效》系列笔记(一):面向对象中的类
- 《码出高效》系列笔记(一):面向对象中的方法
- 《码出高效》系列笔记(一):面向对象中的其他知识点
- 《码出高效》系列笔记(二):代码风格
- 《码出高效》系列笔记(三):异常与日志
- 《码出高效》系列笔记(四):数据结构与集合的框架
- 《码出高效》系列笔记(四):数据结构与集合的数组和泛型
- 《码出高效》系列笔记(四):元素的比较
- 走进JVM之内部布局
- 走进JVM之字节码与类加载
- 走进JVM之GC
GC知识点
主要分三个部分:
- 如何判断该对象要回收(是垃圾)
- 回收的算法有哪些?
- 垃圾收集器
判断一个对象是否可以回收
1. 引用计数法
Python采用该种算法,但是解决了相互引用的问题
为对象添加一个引用计数器,当对象增加一个引用时计数器加 1,引用失效时计数器减 1。引用计数为 0 的对象可被回收。
在两个对象出现循环引用的情况下,此时引用计数器永远不为 0,导致无法对它们进行回收。正是因为循环引用的存在,因此 Java 虚拟机不使用引用计数算法。
2. GC root(可达性算法)
从GCroot出发遍历,标记每个可访达的对象为活动对象,遍历不到的对象(Obj4)就会被接下来要讲的几种算法回收了。
GC root可以是以下几种:
- Java 方法栈桢中的局部变量;
- 已加载类的静态变量;
- JNI handles;
- 已启动且未停止的 Java 线程。
多线程环境下,会产生误报和漏报。
误报:A线程修改了访问,B线程会导致垃圾也被标记了,不会被清除,造成内存浪费。
漏报:将仍被应用的对象标记为垃圾。
误报和漏报的理解:误报大不了不回收嘛,漏报比较严重。垃圾回收是先标记活的对象,后回收死的对象,那么如果标记好后,其它线程产生了垃圾,即将活的变死了,这种内存是不会释放的。另外,如果这时产生了新对象,由于没被标记为活的,所以被释放了,这就危险了。
Q:如何解决?(实际JVM虚拟机并不会出现这种情况)
A:Stop-the-world 以及安全点(安全词),垃圾回收线程工作时,其他非垃圾回收线程一律等待!
垃圾回收算法
1.标记 - 清除算法
利用GC root遍历到的标记(非垃圾),那么其余的就是垃圾了,直接把剩下的对象标记为空闲内存。
- 优点:标记和清除的过程效率不高
- 缺点:产生大量不连续碎片,就无法给大内存的对象分配空间了
2.标记 - 整理算法(压缩算法)
即把存活的对象聚集到内存区域的起始位置,从而留下一段连续的内存空间。
- 优点:结果是很美好的,拥有了连续的内存空间,所以一般老年代使用该种算法,因为老年代的频率明显比新生代低很多。
- 缺点:性能拉胯,毕竟要移动。(让我想到了为么MySQL用b+树,而不用有序数组,因为数据量大的时候插入、删除、移动的效率太低下了)
3.复制算法
将内存划分为大小相等的两块(Java8的中S0、S1),每次只使用其中一块,当这一块内存用完了就将还存活的对象复制到另一块上面,然后再把使用过的内存空间进行一次清理。(有点像数组的System.arraycopy,利用from和to两个指针)。
所以所谓的S0和S1是相互复制然后全标记的,都会成为「空」的空间和复制来的对象的空间。
主要的不足是每次S0和S1肯定有一块是空的,为了接下来的复制,所以也算是小浪费。
HotSpot 虚拟机的 Eden 和 Survivor 大小比例默认为 8:1,保证了内存的利用率达到 90%。如果每次回收有多于 10% 的对象存活,那么一块 Survivor 就不够用了,此时需要依赖于老年代进行空间分配担保,也就是借用老年代的空间存储放不下的对象。
4.分代收集算法
现在的商业虚拟机采用分代收集算法,它根据对象存活周期将内存划分为几块,不同块采用适当的收集算法。
一般将堆分为新生代和老年代。
- 新生代使用:复制算法
- 老年代使用:标记 - 清除 或者 标记 - 整理 算法
5.总结
先Minor GC(Young GC),再Major GC(Full GC)。S0/S1交换14次后晋升至老年代(Java8之后是元空间,位于本地内存),jvm默认值是15。
一般来说OOM是内存耗尽,也有超大内存(不多)的情况。
以上是我画的图,其中少了一步,当新生代晋升至老年代的时候失败怎么办?其实这里是执行Major GC,也就是走下面的那条流程。
垃圾收集器
可以简单理解成新生代搞一个收集器,老年代搞一个收集器,Java8默认的就是Parallel + Parallel Old收集器
串行回收:Serial GC
并行回收:Parallel GC:吞吐量高(因为并行,花费GC的时间少,所以可以让出时间给其他非GC线程),适用于科学计算
并发回收:CMS(ConcMarkSweep,并发标记清除):其实有STW,也有并行。后备方案是Serial Old。而且是标记清除,会有碎片,会导致提前Major GC;吞吐量低,但是适用是高并发、快速响应的场景。
Java9之后的:G1,Java11之后的:ZGC(在G1基础上),使命就是为了替换CMS。
JVM调优配了新生代,老年代会跟着配对应的垃圾收集器。
除了以上4种,主要还有以下3种:
Serial Old(已废弃)
ParNew
ParOld
参数 | 新生代 | 新生代算法 | 老年代(元空间) | 老年代算法 |
---|---|---|---|---|
-xx:+UseSerialGC | Serial | 复制 | Serial old | 标记整理 |
-xx:+UseParNewGC | ParNew | 复制 | Serial old | 标记整理 |
-xx:+UseParallelGC | Parallel | 复制 | Parallel old | 标记整理 |
-xx:+UseConcMarkSweepGC | ParNew | 复制 | CMS / Serial old | 标记清除 |
-xx:+UseG1GC | G1 | 不区别新老年代,整体是标记整理 | 局部是赋值算法 |
G1和CMS的区别:
G1分块设计,会移动不同的内存对象。G1虽然是标记清除算法,但是不会产生碎片
G1可以设置STW的时间,假如设置太小,就会频繁GC,降低吞吐量