4.Java 虚拟机

heaboy2026/5/18大约 44 分钟

4.Java 虚拟机

内存模型

JVM 的内存模型介绍一下

根据 JDK 8 规范，JVM 运行时内存共分为虚拟机栈、堆、元空间、程序计数器、本地方法栈五个

部分。还有一部分内存叫直接内存，属于操作系统的本地内存，也是可以直接操作的。

JVM 的内存结构主要分为以下几个部分：

程序计数器：可以看作是当前线程所执行的字节码的行号指示器，用于存储当前线程正在执行

的 Java 方法的 JVM 指令地址。如果线程执行的是 Native 方法，计数器值为 null 。是唯一一个

在 Java 虚拟机规范中没有规定任何 OutOfMemoryError 情况的区域，生命周期与线程相同。

Java 虚拟机栈：每个线程都有自己独立的 Java 虚拟机栈，生命周期与线程相同。每个方法在执

行时都会创建一个栈帧，用于存储局部变量表、操作数栈、动态链接、方法出口等信息。可能

会抛出 StackOverflowError 和 OutOfMemoryError 异常。

本地方法栈：与 Java 虚拟机栈类似，主要为虚拟机使用到的 Native 方法服务，在 HotSpot 虚

拟机中和 Java 虚拟机栈合二为一。本地方法执行时也会创建栈帧，同样可能出现

StackOverflowError 和 OutOfMemoryError 两种错误。

Java 堆：是 JVM 中最大的一块内存区域，被所有线程共享，在虚拟机启动时创建，用于存放对

象实例。从内存回收⻆度，堆被划分为新生代和老年代，新生代又分为 Eden 区和两个 Survivor

区（From Survivor 和 To Survivor ）。如果在堆中没有内存完成实例分配，并且堆也无法扩展时

会抛出 OutOfMemoryError 异常。

方法区（元空间）：在 JDK 1.8 及以后的版本中，方法区被元空间取代，使用本地内存。用于存

储已被虚拟机加载的类信息、常量、静态变量等数据。虽然方法区被描述为堆的逻辑部分，但

有 “非堆” 的别名。方法区可以选择不实现垃圾收集，内存不足时会抛出 OutOfMemoryError 异

常。

运行时常量池：是方法区的一部分，用于存放编译期生成的各种字面量和符号引用，具有动态性，运行时也可将新的常量放入池中。当无法申请到足够内存时，会抛出 OutOfMemoryError

异常。

直接内存：不属于 JVM 运行时数据区的一部分，通过 NIO 类引入，是一种堆外内存，可以显

著提高 I/O 性能。直接内存的使用受到本机总内存的限制，若分配不当，可能导致

OutOfMemoryError 异常。

JVM 内存模型里的堆和栈有什么区别？

用途：栈主要用于存储局部变量、方法调用的参数、方法返回地址以及一些临时数据。每当一

个方法被调用，一个栈帧（stack frame ）就会在栈中创建，用于存储该方法的信息，当方法执

行完毕，栈帧也会被移除。堆用于存储对象的实例（包括类的实例和数组）。当你使 用 new  关

键字创建一个对象时，对象的实例就会在堆上分配空间。

生命周期：栈中的数据具有确定的生命周期，当一个方法调用结束时，其对应的栈帧就会被销

毁，栈中存储的局部变量也会随之消失。堆中的对象生命周期不确定，对象会在垃圾回收机制

（Garbage Collection, GC ）检测到对象不再被引用时才被回收。

存取速度：栈的存取速度通常比堆快，因为栈遵循先进后出（LIFO, Last In First Out ）的原则，

操作简单快速。堆的存取速度相对较慢，因为对象在堆上的分配和回收需要更多的时间，而且

垃圾回收机制的运行也会影响性能。

存储空间：栈的空间相对较小，且固定，由操作系统管理。当栈溢出时，通常是因为递归过深

或局部变量过大。堆的空间较大，动态扩展，由JVM 管理。堆溢出通常是由于创建了太多的大

对象或未能及时回收不再使用的对象。

可⻅性：栈中的数据对线程是私有的，每个线程有自己的栈空间。堆中的数据对线程是共享

的，所有线程都可以访问堆上的对象。

栈中存的到底是指针还是对象？

在JVM 内存模型中，栈（Stack ）主要用于管理线程的局部变量和方法调用的上下文，而堆

（Heap ）则是用于存储所有类的实例和数组。

当我们在栈中讨论 “存储”时，实际上指的是存储基本类型的数据（如int, double 等）和对象的引

用，而不是对象本身。

这里的关键点是，栈中存储的不是对象，而是对象的引用。也就是说，当你在方法中声明一个对

象，比如 MyObject obj = new MyObject();  ，这里的 obj  实际上是一个存储在栈上的引用，指向

堆中实际的对象实例。这个引用是一个固定大小的数据（例如在64 位系统上是8字节），它指向堆

中分配给对象的内存区域。

堆分为哪几部分呢？

Java 堆（Heap ）是Java 虚拟机（JVM ）中内存管理的一个重要区域，主要用于存放对象实例和数

组。随着JVM 的发展和不同垃圾收集器的实现，堆的具体划分可能会有所不同，但通常可以分为以

下几个部分：

新生代（Young Generation ）:新生代分为Eden Space 和Survivor Space 。在Eden Space 中，大

多数新创建的对象首先存放在这里。Eden 区相对较小，当Eden 区满时，会触发一次Minor GC

（新生代垃圾回收）。在Survivor Spaces 中，通常分为两个相等大小的区域，称为S0 （Survivor 0）和S1 （Survivor 1 ）。在每次 Minor GC 后，存活下来的对象会被移动到其中一个Survivor 空

间，以继续它们的生命周期。这两个区域轮流充当对象的中转站，帮助区分短暂存活的对象和

⻓期存活的对象。

老年代（Old Generation/Tenured Generation ）:存放过一次或多次Minor GC 仍存活的对象会

被移动到老年代。老年代中的对象生命周期较⻓，因此Major GC （也称为Full GC ，涉及老年代

的垃圾回收）发生的频率相对较低，但其执行时间通常比Minor GC ⻓。老年代的空间通常比新

生代大，以存储更多的⻓期存活对象。

元空间（Metaspace ）:从Java 8 开始，永久代（Permanent Generation ）被元空间取代，用于存

储类的元数据信息，如类的结构信息（如字段、方法信息等）。元空间并不在Java 堆中，而是使

用本地内存，这解决了永久代容易出现的内存溢出问题。

大对象区（Large Object Space / Humongous Objects ）:在某些JVM 实现中（如G1 垃圾收集

器），为大对象分配了专⻔的区域，称为大对象区或Humongous Objects 区域。大对象是指需要

大量连续内存空间的对象，如大数组。这类对象直接分配在老年代，以避免因频繁的年轻代晋

升而导致的内存碎片化问题。

如果有个大对象一般是在哪个区域？

大对象通常会直接分配到老年代。

新生代主要用于存放生命周期较短的对象，并且其内存空间相对较小。如果将大对象分配到新生

代，可能会很快导致新生代空间不足，从而频繁触发 Minor GC 。而每次 Minor GC 都需要进行对

象的复制和移动操作，这会带来一定的性能开销。将大对象直接分配到老年代，可以减少新生代

的内存压力，降低 Minor GC 的频率。

大对象通常需要连续的内存空间，如果在新生代中频繁分配和回收大对象，容易产生内存碎片，

导致后续分配大对象时可能因为内存不连续而失败。老年代的空间相对较大，更适合存储大对

象，有助于减少内存碎片的产生。

程序计数器的作用，为什么是私有的？

Java 程序是支持多线程一起运行的，多个线程一起运行的时候cpu 会有一个调动器组件给它们分配

时间片，比如说会给线程1分给一个时间片，它在时间片内如果它的代码没有执行完，它就会把线

程1的状态执行一个暂存，切换到线程2去，执行线程2的代码，等线程2的代码执行到了一定程

度，线程2的时间片用完了，再切换回来，再继续执行线程1剩余部分的代码。

我们考虑一下，如果在线程切换的过程中，下一条指令执行到哪里了，是不是还是会用到我们的

程序计数器啊。每个线程都有自己的程序计数器，因为它们各自执行的代码的指令地址是不一样

的呀，所以每个线程都应该有自己的程序计数器。

方法区中的方法的执行过程？

当程序中通过对象或类直接调用某个方法时，主要包括以下几个步骤：

解析方法调用：JVM 会根据方法的符号引用找到实际的方法地址（如果之前没有解析过的话）。

栈帧创建：在调用一个方法前，JVM 会在当前线程的Java 虚拟机栈中为该方法分配一个新的栈

帧，用于存储局部变量表、操作数栈、动态链接、方法出口等信息。

执行方法：执行方法内的字节码指令，涉及的操作可能包括局部变量的读写、操作数栈的操

作、跳转控制、对象创建、方法调用等。

返回处理：方法执行完毕后，可能会返回一个结果给调用者，并清理当前栈帧，恢复调用者的

执行环境。

方法区中还有哪些东西？

《深入理解Java 虚拟机》书中对方法区（Method Area ）存储内容描述如下：它用于存储已被虚拟

机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等。

类信息：包括类的结构信息、类的访问修饰符、父类与接口等信息。

常量池：存储类和接口中的常量，包括字面值常量、符号引用，以及运行时常量池。

静态变量：存储类的静态变量，这些变量在类初始化的时候被赋值。

方法字节码：存储类的方法字节码，即编译后的代码。

符号引用：存储类和方法的符号引用，是一种直接引用不同于直接引用的引用类型。

运行时常量池：存储着在类文件中的常量池数据，在类加载后在方法区生成该运行时常量池。

常量池缓存：用于提升类加载的效率，将常用的常量缓存起来方便使用。

String 保存在哪里呢？

String 保存在字符串常量池中，不同于其他对象，它的值是不可变的，且可以被多个引用共享。

## String s = new String （“abc” ）执行过程中分别 对应哪些内存区域？

首先，我们看到这个代码中有一个new 关键字，我们知道new 指令是创建一个类的实例对象并完成

加载初始化的，因此这个字符串对象是在运行期才能确定的，创建的字符串对象是在堆内存上。

其次，在String 的构造方法中传递了一个字符串abc ，由于这里的abc 是被final 修饰的属性，所以它

是一个字符串常量。在首次构建这个对象时，JVM 拿字面量"abc" 去字符串常量池试图获取其对应

String 对象的引用。于是在堆中创建了一个"abc" 的String 对象，并将其引用保存到字符串常量池

中，然后返回；

所以，如果abc 这个字符串常量不存在，则创 建两个 对象，分别 是abc 这个字符串常量，以及new String 这个实例对象。如果abc 这字符串常量存在，则只会创建一个对象。

引用类型有哪些？有什么区别？

引用类型主要分为强软弱虚四种：

强引 用指的就是代码中普遍存在的赋值方式，比如A a = new A() 这种。强引 用关联的对象，永

远不会被GC 回收。

软引用可以用SoftReference 来描述，指的是那些有用但是不是必须要的对象。系统在发生内存

溢出前会对这类引用的对象进行回收。

弱引用可以用WeakReference 来描述，他的强度比软引用更低一点，弱引用的对象下一次GC 的

时候一定会被回收，而不管内存是否足够。

虚引用也被称作幻影引用，是最弱的引用关系，可以用PhantomReference 来描述，他必须和

ReferenceQueue 一起使用，同样的当发生GC 的时候，虚引用也会被回收。可以用虚引用来管理

堆外内存。

弱引用了解吗?举例说明在哪里可以用?

Java 中的弱引用是一种引用类型，它不会阻止一个对象被垃圾回收。

在Java 中，弱引用是通过 Java.lang.ref.WeakReference 类实现的。弱引用的一个主要用途是创建

非强制性的对象引用，这些引用可以在内存压力大时被垃圾回收器清理，从而避免内存泄露。

弱引用的使用场景：

缓存系统：弱引用常用于实现缓存，特别是当希望缓存项能够在内存压力下自动释放时。如果

缓存的大小不受控制，可能会导致内存溢出。使用弱引用来维护缓存，可以让JVM 在需要更多

内存时自动清理这些缓存对象。

对象池：在对象池中，弱引用可以用来管理那些暂时不使用的对象。当对象不再被强引用时，

它们可以被垃圾回收，释放内存。

避免内存泄露：当一个对象不应该被⻓期引用时，使用弱引用可以防止该对象被意外地保留，

从而避免潜在的内存泄露。

示例代码：

假设我们有一个缓存系统，我们使用弱引用来维护缓存中的对象：

import  Java .lang .ref .WeakReference ;
import  Java .util .HashMap ;
import  Java .util .Map ;
public  class  CacheExample  {
private  Map <String , WeakReference <MyHeavyObject >> cache  = new  HashMap <>();
public  MyHeavyObject  get (String  key ) {
WeakReference <MyHeavyObject > ref  = cache .get (key );
if  (ref  !=  null ) {
return  ref .get ();
} else  {
MyHeavyObject  obj  = new  MyHeavyObject ();
cache .put (key , new  WeakReference <>(obj ));
return  obj ;
}
}
// 假设 MyHeavyObject 是一个占用大量内存的对象     
private  static  class  MyHeavyObject  {
private  byte [] largeData  = new  byte [1024  * 1024  * 10 ]; // 10MB data 
}
}

在这个例子中，使用 WeakReference 来存储 MyHeavyObject 实例，当内存压力增大时，垃圾回收

器可以自由地回收这些对象，而不会影响缓存的正常运行。

如果一个对象被垃圾 回收，下次尝试从缓存中获取时， get()  方法会返回 null  ，这时我们可以

重新创建对象并将其放入缓存中。因此，使用弱引用时要注意，一旦对象被垃圾回收，通过弱引

用获取的对象可能会变为 null ，因此在使用前通常需要检查这一点。

内存泄漏和内存溢出的理解？

内存泄露：内存泄漏是指程序在运行过程中不再使用的对象仍然被引用，而无法被垃圾收集器回

收，从而导致可用内存逐渐减少。虽然在Java 中，垃圾回收机制会自动回收不再使用的对象，但如

果有对象仍被不再使用的引用持有，垃圾收集器无法回收这些内存，最终可能导致程序的内存使

用不断增加。

内存泄露常⻅原因：

静态集合：使用静态数据结构（如 HashMap 或 ArrayList ）存储对象，且未清理。

事件监听：未取消对事件源的监听，导致对象持续被引用。

线程：未停止的线程可能持有对象引用，无法被回收。

内存溢出：内存溢出是指Java 虚拟机（JVM ）在申请内存时，无法找到足够的内存，最终引发

OutOfMemoryError 。这通常发生在堆内存不足以存放新创建的对象时。

内存溢出常⻅原因：

大量对象创建：程序中不断创建大量对象，超出JVM 堆的限制。

持久引用：大型数据结构（如缓存、集合等）⻓时间持有对象引用，导致内存累积。

递归调用：深度递归导致栈溢出。

jvm 内存结构有哪几种内存溢出的情况？

堆内存溢出：当出现Java.lang.OutOfMemoryError:Java heap space 异常时，就是堆内存溢出

了。原因是代码中可能存在大对象分配，或者发生了内存泄露，导致在多次GC 之后，还是无法

找到一块足够大的内存容纳当前对象。

栈溢出：如果我们写一段程序不断的进行递归调用，而且没有退出条件，就会导致不断地进行

压栈。类似这种情况，JVM 实际会抛出 StackOverFlowError ；当然，如果 JVM 试图去扩展栈空

间的的时候失败，则会抛出 OutOfMemoryError 。

元空间溢出：元空间的溢出，系统会抛出Java.lang.OutOfMemoryError: Metaspace 。出现这个

异常的问题的原因是系统的代码非常多或引用的第三方包非常多或者通过动态代码生成类加载

等方法，导致元空间的内存占用很大。

直接内存内存溢出：在使用ByteBuffer 中的allocateDirect() 的时候会用到，很多JavaNIO( 像netty)

的框架中被封装为其他的方法，出现该问题时会抛出Java.lang.OutOfMemoryError: Direct buffer memory 异常。

有具体的内存泄漏和内存溢出的例子么请举例及解决方案?

1、静态属性导致内存泄露

会导致内存泄露的一种情况就是大量使用static 静态变量。在Java 中，静态属性的生命周期通常伴

随着应用整个生命周期（除非ClassLoader 符合垃圾回收的条件）。下面来看一个具体的会导致内存

泄露的实例：

public  class  StaticTest  {
public  static  List <Double > list  = new  ArrayList <>();
public  void  populateList () {
for  (int  i = 0; i < 10000000 ; i++ ) {
list .add (Math .random ());
}
Log .info ("Debug Point 2" );
}
public  static  void  main (String [] args ) {
Log .info ("Debug Point 1" );
new  StaticTest ().populateList ();
Log .info ("Debug Point 3" );
}
}

如果监控内存堆内存的变化，会发现在打印Point1 和Point2 之间，堆内存会有一个明显的增⻓趋势图。但当执行完populateList 方法之后，对堆内存并没有被垃圾回收器进行回收。

但针对上述程序，如果将定义list 的变量前的static 关键字去掉，再次执行程序，会发现内存发生了

具体的变化。VisualVM 监控信息如下图：

对比两个图可以看出，程序执行的前半部分内存使用情况都一样，但当执行完populateList 方法之

后，后者不再有引用指向对应的数据，垃圾回收器便进行了回收操作。因此，我们要十分留意

static 的变量，如果集合或大量的对象定义为 static 的，它们会停留在整个应用程序的生命周期当

中。而它们所占用的内存空间，本可以用于其他地方。

那么如何优化呢？第一，进来减少静态变量；第二，如果使用单例，尽量采用懒加载。

2、未关闭的资源

无论什么时候当我们创建一个连接或打开一个流，JVM 都会分配内存给这些资源。比如，数据库链

接、输入流和session 对象。

忘记关闭这些资源，会阻塞内存，从而导致GC 无法进行清理。特别是当程序发生异常时，没有在

finally 中进行资源关闭的情况。这些未正常关闭的连接，如果不进行处理，轻则影响程序性能，重

则导致OutOfMemoryError 异常发生。

如果进行处理呢？第一，始终记得在finally 中进行资源的关闭；第二，关闭连接的自身代码不能发

生异常；第三，Java7 以上版本可使用try-with-resources 代码方式进行资源关闭。

3、使用ThreadLocal

ThreadLocal 提供了线程本地变量，它可以保证访问到的变量属于当前线程，每个线程都保存有一

个变量副本，每个线程的变量都不同。ThreadLocal 相当于提供了一种线程隔离，将变量与线程相

绑定，从而实现线程安全的特性。

ThreadLocal 的实现中，每个Thread 维护一个ThreadLocalMap 映射表，key 是ThreadLocal 实例本身，value 是真正需要存储的Object 。

ThreadLocalMap 使用ThreadLocal 的弱引用作为key ，如果一个ThreadLocal 没有外部强引用来引用它，那么系统GC 时，这个ThreadLocal 势必会被回收，这样一来，ThreadLocalMap 中就会出现key 为null 的Entry ，就没有办法访问这些key 为null 的Entry 的value 。

如果当前线程迟迟 不结束的话，这些key 为null 的Entry 的value 就会一直存在一条强引 用链：Thread Ref -> Thread -> ThreaLocalMap -> Entry -> value 永远无法回收，造成内存泄漏。

如何解决此问题？

第一，使用ThreadLocal 提供的remove 方法，可对当前线程中的value 值进行移除；

第二，不要使用ThreadLocal.set(null) 的方式清除value ，它实 际上并没有清除值，而是查找与当

前线程关联的Map 并将键值对分别设置为当前线程和null 。

第三，最好将ThreadLocal 视为需要在finally 块中关闭的资源，以确保即使在发生异常的情况下也始终关闭该资源。

try  {
threadLocal .set (System .nanoTime ());
//... further processing 
} finally  {
threadLocal .remove ();
}

类初始化和类加载

创建对象的过程？

在Java 中创建对象的过程包括以下几个步骤：

类加载检查：虚拟机遇到一条 new 指令时，首先将去检查这个指令的参数是否能在常量池中定

位到一个类的符号引用，并且检查这个符号引用代表的类是否已被加载过、解析和初始化过。

如果没有，那必须先执行相应的类加载过程。

分配内存：在类加载检查通过后，接下来虚拟机将为新生对象分配内存。对象所需的内存大小

在类加载完成后便可确定，为对象分配空间的任务等同于把一块确定大小的内存从 Java 堆中划分出来。

初始化零值：内存分配完成后，虚拟机需要将分配到的内存空间都初始化为零值（不包括对象

头），这一步操作保证了对象的实例字段在 Java 代码中可以不赋初始值就直接使用，程序能访

问到这些字段的数据类型所对应的零值。

进行必要设置，比如对象头：初始化零值完成之后，虚拟机要对对象进行必要的设置，例如这

个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的 GC 分代年龄

等信息。这些信息存放在对象头中。另外，根据虚拟机当前运行状态的不同，如是否启用偏向

锁等，对象头会有不同的设置方式。

执行 init 方法：在上面工作都完成之后，从虚拟机的视⻆来看，一个新的对象已经产生了，但

从 Java 程序的视⻆来看，对象创建才刚开始—— 构造函数，即class 文件中的方法还没有执行，

所有的字段都还为零，对象需要的其他资源和状态信息还没有按照预定的意图构造好。所以一

般来说，执行 new 指令之后会接着执行方法，把对象按照程序员的意愿进行初始化，这样一个

真正可用的对象才算完全被构造出来。

对象的生命周期

对象的生命周期包括创建、使用和销毁三个阶段：

创建：对象通过关键字new 在堆内存中被实例化，构造函数被调用，对象的内存空间被分配。

使用：对象被引用并执行相应的操作，可以通过引用访问对象的属性和方法，在程序运行过程

中被不断使用。

销毁：当对象不再被引用时，通过垃圾回收机制自动回收对象所占用的内存空间。垃圾回收器

会在适当的时候检测并回收不再被引用的对象，释放对象占用的内存空间，完成对象的销毁过

程。

类加载器有哪些？

启动类加载器（ Bootstrap Class Loader ）：这是最顶层的类加载器，负责加载Java 的核心库（如

位于jre/lib/rt.jar 中的类），它是用C++ 编写的，是JVM 的一部分。启动类加载器无法被Java 程序

直接引用。

扩展类加载器（ Extension Class Loader ）：它是Java 语言实现的，继承自ClassLoader 类，负责

加载Java 扩展目录（jre/lib/ext 或由系统变量Java.ext.dirs 指定的目录）下的jar 包和类库。扩展类

加载器由启动类加载器加载，并且父加载器就是启动类加载器。

系统类加载器（ System Class Loader ）/ 应用程序类加载器（ Application Class Loader ）：这也

是Java 语言实现的，负责加载用⼾类路径（ClassPath ）上的指定类库，是我们平时编写Java 程

序时默认使用的类加载器。系统类加载器的父加载器是扩展类加载器。它可以通过

ClassLoader.getSystemClassLoader() 方法获取到。

自定义类加载器（ Custom Class Loader ）：开发者可以根据需求定制类的加载方式，比如从网

络加载class 文件、数据库、甚至是加密的文件中加载类等。自定义类加载器可以用来扩展Java

应用程序的灵活性和安全性，是Java 动态性的一个重要体现。

这些类加载器之间的关系形成了双亲委派模型，其核心思想是当一个类加载器收到类加载的请求

时，首先不会自己去尝试加载这个类，而是把这个请求委派给父类加载器去完成，每一层次的类

加载器都是如此，因此所有的加载请求最终都应该传送到顶层的启动类加载器中。

只有当父加载器反馈自己无法完成这个加载请求（它的搜索范围中没有找到所需的类）时，子加

载器才会尝试自己去加载。

双亲委派模型的作用

保证类的唯一性：通过委托机制，确保了所有加载请求都会传递到启动类加载器，避免了不同

类加载器重复加载相同类的情况，保证了Java 核心类库的统一性，也防止了用⼾自定义类覆盖

核心类库的可能。

保证安全性：由于Java 核心库被启动类加载器加载，而启动类加载器只加载信任的类路径中的

类，这样可以防止不可信的类假冒核心类，增强了系统的安全性。例如，恶意代码无法自定义

一个Java.lang.System 类并加载到JVM 中，因为这个请求会被委托给启动类加载器，而启动类加

载器只会加载标准的Java 库中的类。

支持隔离和层次划分：双亲委派模型支持不同层次的类加载器服务于不同的类加载需求，如应

用程序类加载器加载用⼾代码，扩展类加载器加载扩展框架，启动类加载器加载核心库。这种

层次化的划分有助于实现沙箱安全机制，保证了各个层级类加载器的职责清晰，也便于维护和

扩展。

简化了加载流程：通过委派，大部分类能够被正确的类加载器加载，减少了每个加载器需要处

理的类的数量，简化了类的加载过程，提高了加载效率。

讲一下类加载过程？

类从被加载到虚拟机内存开始，到卸载出内存为止，它的整个生命周期包括以下 7 个阶段：

加载：通过类的全限定名（包名 + 类名），获取到该类的.class 文件的二进制字节流，将二进制

字节流所代表的静态存储结构，转化为方法区运行时的数据结构，在内存中生成一个代表该类

的Java.lang.Class 对象，作为方法区这个类的各种数据的访问入口

连接：验证、准备、解析 3 个阶段统称为连接。

验证：确保class 文件中的字节流包含的信息，符合当前虚拟机的要求，保证这个被加载的

class 类的正确性，不会危害到虚拟机的安全。验证阶段大致会完成以下四个阶段的检验动

作：文件格式校验、元数据验证、字节码验证、符号引用验证

准备：为类中的静态字段分配内存，并设置默认的初始值，比如int 类型初始值是0。被final

修饰的static 字段不会设置，因为final 在编译的时候就分配了

解析：解析阶段是虚拟机将常量池的「符号引用」直接替换为「直接引用」的过程。符号引

用是以一组符号来描述所引用的目标，符号可以是任何形式的字面量，只要使用的时候可以

无歧义地定位到目标即可。直接引用可以是直接指向目标的指针、相对偏移量或是一个能间

接定位到目标的句柄，直接引用是和虚拟机实现的内存布局相关的。如果有了直接引用，那

引用的目标必定已经存在在内存中了。

初始化：初始化是整个类加载过程的最后一个阶段，初始化阶段简单来说就是执行类的构造器

方法（() ），要注意的是这里的构造器方法() 并不是开发者写的，而是编译器自动生成的。

使用：使用类或者创建对象

卸载：如果有下面的情况，类就会被卸载：1. 该类所有的实例都已经被回收，也就是Java 堆中不存在该类的任何实例。2. 加载该类的ClassLoader 已经被回收。 3. 类对应的Java.lang.Class 对

象没有任何地方被引用，无法在任何地方通过反射访问该类的方法。

讲一下类的加载和双亲委派原则

我们把 Java 的类加载过程分为三个主要步骤：加载、链接、初始化。

首先是加载阶段（Loading ），它是 Java 将字节码数据从不同的数据源读取到 JVM 中，并映射为

JVM 认可的数据结构（Class 对象），这里的数据源可能是各种各样的形态，如 jar  文件、class  文

件，甚至是网络数据源等；如果输入数据不是 ClassFile 的结构，则会抛出 ClassFormatError 。

加载阶段是用⼾参与的阶段，我们可以自定义类加载器，去实现自己的类加载过程。

第二阶段是链接（Linking ），这是核心的步骤，简单说是把原始的类定义信息平滑地转化入 JVM

运行的过程中。这里可进一步细分为三个步骤：

验证（Verification ），这是虚拟机安全的重要保障，JVM 需要核验字节信息是符合 Java 虚拟机

规范的，否则就被认为是 VerifyError ，这样就防止了恶意信息或者不合规的信息危害 JVM 的运

行，验证阶段有可能触发更多 class 的加载。

准备（Preparation ），创建类或接口中的静态变量，并初始化静态变量的初始值。但这里的“初

始化”和下面的显式初始化阶段是有区别的，侧重点在于分配所需要的内存空间，不会去执行更

进一步的 JVM 指令。

解析（Resolution ），在这一步会将常量池中的符号引用（symbolic reference ）替换为直接引

用。

最后是初始化阶段（initialization ），这一步真正去执行类初始化的代码逻辑，包括静态字段赋值的

动作，以及执行类定义中的静态初始化块内的逻辑，编译器在编译阶段就会把这部分逻辑整理

好，父类型的初始化逻辑优先于当前类型的逻辑。

再来谈谈双亲委派模型，简单说就是当类加载器（ Class-Loader ）试图加载某个类型的时候，除非

父加载器找不到相应类型，否则尽量将这个任务代理给当前加载器的父加载器去做。使用委派模

型的目的是避免重复加载 Java 类型。

垃圾回收

什么是Java 里的垃圾回收？如何触发垃圾回收？

垃圾回收（Garbage Collection, GC ）是自动管理内存的一种机制，它负责自动释放不再被程序引

用的对象所占用的内存，这种机制减少了内存泄漏和内存管理错误的可能性。垃圾回收可以通过

多种方式触发，具体如下：

内存不足时：当JVM 检测到堆内存不足，无法为新的对象分配内存时，会自动触发垃圾回收。

手动请求：虽然垃圾 回收是自动的，开发者可以通过调用 System.gc()  或 
> Runtime.getRuntime().gc()

建议 JVM 进行垃圾回收。不过这只是一个建议，并不能保证立即执行。

JVM 参数：启动 Java 应用时可以通过 JVM 参数来调整垃圾回收的行为，比如： -Xmx （最大堆

大小）、 -Xms （初始堆大小）等。

对象数量或内存使用达到阈值：垃圾收集器内部实现了一些策略，以监控对象的创建和内存使

用，达到某个阈值时触发垃圾回收。

判断垃圾的方法有哪些？

在Java 中，判断对象是否为垃圾（即不再被使用，可以被垃圾回收器回收）主要依据两种主流的垃圾回收算法来实现：引用计数法和可达性分析算法。

引用计数法（Reference Counting ）

原理：为每个对象分配一个引用计数器，每当有一个地方引用它时，计数器加1；当引用失效

时，计数器减1。当计数器为0时，表示对象不再被任何变量引用，可以被回收。

缺点：不能解决循环引用的问题，即两个对象相互引用，但不再被其他任何对象引用，这时引

用计数器不会为0，导致对象无法被回收。

可达性分析算法（Reachability Analysis ）

Java 虚拟机主要采用此算法来判断对象是否为垃圾。

原理：从一组称为GC Roots （垃圾收集根）的对象出发，向下追溯它们引用的对象，以及这些

对象引用的其他对象，以此类推。如果一个对象到GC Roots 没有任何引用链相连（即从GC Roots 到这个对象不可达），那么这个对象就被认为是不可达的，可以被回收。GC Roots 对象包

括：虚拟机栈（栈帧中的本地变量表）中引用的对象、方法区中类静态属性引用的对象、本地

方法栈中JNI （Java Native Interface ）引用的对象、活跃线程的引用等。

垃圾回收算法是什么，是为了解决了什么问题？

JVM 有垃圾回收机制的原因是为了解决内存管理的问题。在传统的编程语言中，开发人员需要手动分配和释放内存，这可能导致内存泄漏、内存溢出等问题。而Java 作为一种高级语言，旨在提供更

简单、更安全的编程环境，因此引入了垃圾回收机制来自动管理内存。

垃圾回收机制的主要目标是自动检测和回收不再使用的对象，从而释放它们所占用的内存空间。

这样可以避免内存泄漏（一些对象被分配了内存却无法被释放，导致内存资源的浪费）。同时，垃圾回收机制还可以防止内存溢出（即程序需要的内存超过了可用内存的情况）。

通过垃圾回收机制，JVM 可以在程序运行时自动识别和清理不再使用的对象，使得开发人员无需手

动管理内存。这样可以提高开发效率、减少错误，并且使程序更加可靠和稳定。

垃圾回收算法有哪些？

标记-清除算法：标记-清除算法分为“标记”和“清除”两个阶段，首先通过可达性分析，标记出所

有需要回收的对象，然后统一回收所有被标记的对象。标记-清除算法有两个缺陷，一个是效率

问题，标记和清除的过程效率都不高，另外一个就是，清除结束后会造成大量的碎片空间。有

可能会造成在申请大块内存的时候因为没有足够的连续空间导致再次 GC 。

复制算法：为了解决碎片空间的问题，出现了“复制算法”。复制算法的原理是，将内存分成两

块，每次申请内存时都使用其中的一块，当内存不够时，将这一块内存中所有存活的复制到另

一块上。然后将然后再把已使用的内存整个清理掉。复制算法解决了空间碎片的问题。但是也

带来了新的问题。因为每次在申请内存时，都只能使用一半的内存空间。内存利用率严重不

足。

标记-整理算法：复制算法在 GC 之后存活对象较少的情况下效率比较高，但如果存活对象比较

多时，会执行较多的复制操作，效率就会下降。而老年代的对象在 GC 之后的存活率就比较

高，所以就有人提出了“标记-整理算法”。标记-整理算法的“标记”过程与“标记-清除算法”的标记

过程一致，但标记之后不会直接清理。而是将所有存活对象都移动到内存的一端。移动结束后

直接清理掉剩余部分。

分代回收算法：分代收集是将内存划分成了新生代和老年代。分配的依据是对象的生存周期，

或者说经历过的 GC 次数。对象创建时，一般在新生代申请内存，当经历一次 GC 之后如果对还

存活，那么对象的年龄 +1 。当年龄超过一定值(默认是 15 ，可以通过参数 -XX:MaxTenuringThreshold 来设定)后，如果对象还存活，那么该对象会进入老年代。

垃圾回收器有哪些？

Serial 收集器（ 复制算法): 新生代单线程收集器， 标记和清理都是单线程，优点是简单高效；
ParNew 收集器 (复制算法): 新生代收并行集器， 实际上是Serial 收集器的多线程版本，在多核

CPU 环境下有着比Serial 更好的表现；

Parallel Scavenge 收集器 (复制算法): 新生代并行收集器， 追求高吞吐 量，高效利用 CPU 。吞吐 
量 = 用⼾线程时间/( 用⼾线程时间+GC 线程时间)，高吞吐 量可以高效率的利用CPU 时间，尽快

完成程序的运算任务，适合后台应用等对交互相应要求不高的场景；

Serial Old 收集器 (标记-整理算法):  老年代单线程收集器， Serial 收集器的老年代版本；

Parallel Old 收集器 (标记-整理算法)：老年代并行收集器，吞吐量优先，Parallel Scavenge 收集

器的老年代版本；

CMS(Concurrent Mark Sweep) 收集器（ 标记-清除算法）： 老年代并行收集器， 以获取最短回收

停顿时间为目标的收集器，具有高并发、低停顿的特点，追求最短GC 回收停顿时间。

G1(Garbage First) 收集器 (标记-整理算法)： Java 堆并行收集器， G1 收集器是JDK1.7 提供的一个

新收集器， G1 收集器基于“标记-整理”算法实现，也就是说不会产生内存碎片。此外，G1 收集器

不同于之前的收集器的一个重要特点是：G1 回收的范围是整个Java 堆(包括新生代，老年代)，而

前六种收集器回收的范围仅限于新生代或老年代

标记清除算法的缺点是什么？

主要缺点有两个：

一个是效率问题，标记和清除过程的效率都不高；

另外一个是空间问题，标记清除之后会产生大量不连续的内存碎片，空间碎片太多可能会导

致，当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触

发另一次垃圾收集动作。

垃圾回收算法哪些阶段会stop the world?

标记-复制算法应用在CMS 新生代（ParNew 是CMS 默认的新生代垃圾回收器）和G1 垃圾回收器

中。标记-复制算法可以分为三个阶段：

标记阶段，即从GC Roots 集合开始，标记活跃对象；

转移阶段，即把活跃对象复制到新的内存地址上；

重定位阶段，因为转移导致对象的地址发生了变化，在重定位阶段，所有指向对象旧地址的指

针都要调整到对象新的地址上。

下面以G1 为例，通过G1 中标记-复制算法过程（G1 的Young GC 和Mixed GC 均采用该算法），分析G1 停顿耗时的主要瓶颈。G1 垃圾回收周期如下图所示：

G1 的混合回收过程可以分为标记阶段、清理阶段和复制阶段。

标记阶段停顿分析

初始标记阶段：初始标记阶段是指从GC Roots 出发标记全部直接子节点的过程，该阶段是STW

的。由于GC Roots 数量不多，通常该阶段耗时非常短。

并发标记阶段：并发标记阶段是指从GC Roots 开始对堆中对象进行可达性分析，找出存活对

象。该阶段是并发的，即应用线程和GC 线程可以同时活动。并发标记耗时相对⻓很多，但因为不是STW ，所以我们不太关心该阶段耗时的⻓短。

再标记阶段：重新标记那些在并发标记阶段发生变化的对象。该阶段是STW 的。

清理阶段停顿分析

清理阶段清点出有存活对象的分区和没有存活对象的分区，该阶段不会清理垃圾对象，也不会

执行存活对象的复制。该阶段是STW 的。

复制阶段停顿分析

复制算法中的转移阶段需要分配新内存和复制对象的成员变量。转移阶段是STW 的，其中内存

分配通常耗时非常短，但对象成员变量的复制耗时有可能较⻓，这是因为复制耗时与存活对象

数量与对象复杂度成正比。对象越复杂，复制耗时越⻓。

四个STW 过程中，初始标记因为只标记GC Roots ，耗时较短。再标记因为对象数少，耗时也较

短。清理阶段因为内存分区数量少，耗时也较短。转移阶段要处理所有存活的对象，耗时会较

⻓。

因此，G1 停顿时间的瓶颈主要是标记-复制中的转移阶段STW 。

minorGC 、majorGC 、fullGC 的区别，什么场景触发full GC

在Java 中，垃圾回收机制是自动管理内存的重要组成部分。根据其作用范围和触发条件的不同，可

以将GC 分为三种类型：Minor GC （也称为Young GC ）、Major GC （有时也称为Old GC ）、以及Full GC 。以下是这三种GC 的区别和触发场景：

Minor GC (Young GC)

作用范围：只针对年轻代进行回收，包括Eden 区和两个 Survivor 区（S0 和S1 ）。

触发条件：当Eden 区空间不足时，JVM 会触发一次Minor GC ，将Eden 区和一个Survivor 区中的

存活对象移动到另一个Survivor 区或老年代（Old Generation ）。

特点：通常发生得非常频繁，因为年轻代中对象的生命周期较短，回收效率高，暂停时间相对

较短。

Major GC

作用范围：主要针对老年代进行回收，但不一定只回收老年代。

触发条件：当老年代空间不足时，或者系统检测到年轻代对象晋升到老年代的速度过快，可能

会触发Major GC 。

特点：相比Minor GC ，Major GC 发生的频率较低，但每次回收可能需要更⻓的时间，因为老年

代中的对象存活率较高。

Full GC

作用范围：对整个堆内存（包括年轻代、老年代以及永久代/元空间）进行回收。

触发条件：

直接调用 System.gc()  或 Runtime.getRuntime().gc()  方法时，虽然不能保证立即执行，但

JVM 会尝试执行Full GC 。

Minor GC （新生代垃圾回收）时，如果存活的对象无法全部放入老年代，或者老年代空间不

足以容纳存活的对象，则会触发Full GC ，对整个堆内存进行回收。

当永久代（Java 8 之前的版本）或元空间（Java 8 及以后的版本）空间不足时。

特点：Full GC 是最昂贵的操作，因为它需要停止所有的工作线程（Stop The World ），遍历整个

堆内存来查找和回收不再使用的对象，因此应尽量减少Full GC 的触发。

垃圾回收器 CMS 和 G1 的区别？

区别一：使用的范围不一样：

CMS 收集器是老年代的收集器，可以配合新生代的Serial 和ParNew 收集器一起使用

G1 收集器收集范围是老年代和新生代。不需要结合其他收集器使用

区别二：STW 的时间：

CMS 收集器以最小的停顿时间为目标的收集器。

G1 收集器可预测垃圾回收的停顿时间（建立可预测的停顿时间模型）

区别三：垃圾碎片

CMS 收集器是使用“标记-清除”算法进行的垃圾回收，容易产生内存碎片

G1 收集器使用的是“标记-整理”算法，进行了空间整合，没有内存空间碎片。

区别四：垃圾回收的过程不一样

注意这两个收集器第四阶段得不同

区别五: CMS 会产生浮动垃圾

CMS 产生浮动垃圾过多时会退化为serial old ，效率低，因为在上图的第四阶段，CMS 清除垃圾

时是并发清除的，这个时候，垃圾回收线程和用⼾线程同时工作会产生浮动垃圾，也就意味着

CMS 垃圾回收器必须预留一部分内存空间用于存放浮动垃圾

而G1 没有浮动垃圾，G1 的筛选回收是多个垃圾回收线程并行gc 的，没有浮动垃圾的回收，在执

行‘并发清理’步骤时，用⼾线程也会同时产生一部分可回收对象，但是这部分可回收对象只能在

下次执行清理是才会被回收。如果在清理过程中预留给用⼾线程的内存不足就会出

现‘Concurrent Mode Failure’, 一旦出现此错误时便会切换到SerialOld 收集方式。

什么情况下使用CMS ，什么情况使用G1?

CMS 适用场景：

低延迟需求：适用于对停顿时间要求敏感的应用程序。

老生代收集：主要针对老年代的垃圾回收。

碎片化管理：容易出现内存碎片，可能需要定期进行Full GC 来压缩内存空间。

G1 适用场景：

大堆内存：适用于需要管理大内存堆的场景，能够有效处理数GB 以上的堆内存。

对内存碎片敏感：G1 通过紧凑整理来减少内存碎片，降低了碎片化对性能的影响。

比较平衡的性能：G1 在提供较低停顿时间的同时，也保持了相对较高的吞吐量。

G1 回收器的特色是什么？

G1 的特点：

G1 最大的特点是引入分区的思路，弱化了分代的概念。

合理利用垃圾收集各个周期的资源，解决了其他收集器、甚至 CMS 的众多缺陷

G1 相比较 CMS 的改进：

算法： G1 基于标记--整理算法, 不会产生空间碎片，在分配大对象时，不会因无法得到连续的

空间，而提前触发一次 FULL GC 。

停顿时间可控： G1 可以通过设置预期停顿时间（Pause Time ）来控制垃圾收集时间避免应用雪

崩现象。

并行与并发：G1 能更充分的利用 CPU 多核环境下的硬件优势，来缩短 stop the world 的停顿

时间。

GC 只会对堆进行GC 吗？

JVM 的垃圾回收器不仅仅会对堆进行垃圾回收，它还会对方法区进行垃圾回收。

堆（Heap ）：堆是用于存储对象实例的内存区域。大部分的垃圾回收工作都发生在堆上，因为

大多数对象都会被分配在堆上，而垃圾回收的重点通常也是回收堆中不再被引用的对象，以释

放内存空间。

方法区（Method Area ）：方法区是用于存储类信息、常量、静态变量等数据的区域。虽然方法

区中的垃圾回收与堆有所不同，但是同样存在对不再需要的常量、无用的类信息等进行清理的

过程。