JVM体系架构概述
- JVM内存结构
类加载器 ClassLoader
- 负责加载class文件,class文件在文件开头有特定的文件标示,将class文件字节码内容加载到内存中,并将这些内容换成方法区中的运行时数据结构并且ClassLoader只负责class文件加载,至于是否可运行,则由执行引擎Execution Engine决定。
- JVM中提供了三层的ClassLoader:
- Bootstrap classLoader 启动类加载器:主要负责加载核心的类库(java.lang.*等),构造ExtClassLoader和APPClassLoader
- ExtClassLoader扩展类加载器:主要负责加载jre/lib/ext目录下的一些扩展的jar。
- AppClassLoader应用程序类加载器:主要负责加载应用程序的主函数类
双亲委派机制
双亲委派模型的工作作过程是 :如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器中,只有当父加载器反馈自己无法完全这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去加载。
这种设计有个好处是,如果有人想替换系统级别的类:String.java,篡改它的实现,在这种机制下这些系统的类已经被Bootstrap classLoader加载过了。所以其他类加载器并没有机会再去加载,从一定程度上防止了危险代码的植入。
Tips
- 假设当一个Hello.class这样的文件要被加载时。不考虑我们自定义类加载器,首先会在AppClassLoader中检查是否加载过,如果有那就无需再加载了。如果没有,那么会拿到父加载器,然后调用父加载器的loadClass方法。父类中同理也会先检查自己是否已经加载过,如果没有再往上。注意这个类似递归的过程,直到到达Bootstrap classLoader之前,都是在检查是否加载过,并不会选择自己去加载。直到BootstrapClassLoader,已经没有父加载器了,这时候开始考虑自己是否能加载了,如果自己无法加载,会下沉到子加载器去加载,一直到最底层,如果没有任何加载器能加载,就会抛出ClassNotFoundException。
沙箱安全机制
- 字节码校验器(bytecode verifier):确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。
- 类装载器(class loader):其中类装载器在3个方面对Java沙箱起作用
- 它防止恶意代码去干涉善意的代码;
- 它守护了被信任的类库边界;
- 它将代码归入保护域,确定了代码可以进行哪些操作。
Tips
- 比如我定义了一个类名为String所在包为java.lang,因为这个类本来是属于jdk的,如果没有沙箱安全机制的话,这个类将会污染到我所有的String,但是由于沙箱安全机制,所以就委托顶层的bootstrap加载器查找这个类,如果没有的话就委托extsion,extsion没有就到aapclassloader,但是由于String就是jdk的源代码,所以在bootstrap那里就加载到了,先找到先使用,所以就使用bootstrap里面的String,后面的一概不能使用,这就保证了不被恶意代码污染
本地接口 Native Interface
- 本地接口的作用是融合不同的语言为java所用,它的初衷是融合C/C++程序。所以在内存中开辟了一块空间处理标记为native的代码。它的具体做法是本地方法栈(Native Method Stack)中登记native方法,在执行引擎(Execution Engine)执行是加载native libraies
程序计数器(PC寄存器) Program Counter Register
- 每个线程都有一个程序计数器,是线程私有的。就是一个指针指向方法区中的方法字节码(用来存储下一条指令的地址,也就是即将要执行的指令代码)。这是个非常小的内存空间。如果是native方法,这个计数器是空的
- 该程序计数器用于完成分支、循环、跳转、异常处理、线程恢复等基础功能。该内存空间不会发生OOM错误。
方法区 Method Area
- 供各线程共享的运行时内存区域。它存储了每一个类的结构信息(类的模板信息),例如运行时常量池、字段和方法数据、构造函数和普通方法的字节码内容。
- 方法区是规范,在不同的虚拟机里实现不同,最典型的是永久代(PermGen space) 1.7和元空间(Metaspace)1.8+
- 实例变量在堆内存中,和方法区无关
栈 Jave Stack
- 栈也叫栈内存,主管java程序运行,是在线程创建时创建(线程私有),它的生命周期是跟随线程的生命周期。所以对于栈来说不存在垃圾回收问题。8种基本类型变量 + 对象的引用变量 + 实例方法都是在函数的占内存中分配。
- 栈存储什么
- 本地变量:输入参数、输出参数以及方法内变量
- 栈操作:记录入栈、出栈操作
- 栈帧数据:包括类文件、方法等
- StackOverflowError 栈溢出错误
- 简单理解就是栈被压爆了(简单操作就是递归且没结束条件),导致溢出
Tips
- 栈管运行,堆管存储
- 栈和FIFO相反,先进后出
- 栈帧:**每个方法执行时都会创建一个栈帧,有用存储局部变量表、操作数栈、动态链接、方法出口等信息.**每个方法从调用直至执行完毕的过程,就对应着一个栈桢在虚拟机中从入栈到出栈的过程。栈的大小和具体JVM实现有关,通常在256K~756K之间,约等于1M左右。
堆 Heap
堆内存空间结构
逻辑上,堆内存分为
新生、老年、元空间MetaSpace(1.7之前叫永久区Perm Gen)
,在物理上之分为新生、老年
两个区。新生区是类的诞生、成长、消亡的区域,一个类在这里产生,应用,最后被垃圾回收器回收,结束生命。新区分为两个区,
伊甸区Eden Space
和Survivor Space
。所有类都是在伊甸区Eden Space被new出来的,幸存区有两个0区和1区。当Eden Space空间用完时,程序又要创建新的对象,JVM的垃圾回收器会对Eden Space进行依次Minor GC(会清空Eden区),将不在被其它对象引用的对象进行销毁,然后再将剩余的对象移放进Survivor 0 Space。若Survivor 0 Space也满了,则再次进行YGC,剩余的存活者放入Survivor 1 Space。若Survivor 1 Space满了,继续YGC放回Survivor 0 Space。达到一定次数后(JVM参数MaxTenuringThreshold设置,默认15),还存活的对象,就会放入老年代。老年代满了以后会进行Full GC(重量级GC)进行内存清理,若老年代FGC还是无法满足对新对象的存储,就会产生OOM异常(OutOfMemoryError)。- 如果出现OOM异常,说明了java虚拟机内存不够,原因有二
- java内存堆空间设置不够,可以通过调整-Xms、-Xmx来调整
- 代码中创建了大量对象,并且长时间不能被垃圾回收机制回收(存在被引用)
- 如果出现OOM异常,说明了java虚拟机内存不够,原因有二
Survivor 0 Space 也叫from区,Survivor 1 Space叫to区,他俩不是固定的,即from区进行垃圾回收以后,把存活的复制到to区,然后清空from区。这时候他俩交换,这时候空的from区就变成了to区,而有存活对象的to区变成from区。幸存者区一定有一个是空的
eden和from、to区比例是 8:1:1,新生与老年区分别是1/3、2/3
Minor GC后,有一种情况是from区放不下存活的对象,这时候会部分放入老年代
永久代 Parmanent Gen JDK7
- 实际而言,
方法区Method Area
和堆Heap
一样,是各线程共享区域,用于存储虚拟机加载的:类信息+普通常量+静态常量+编译器编译后代码等。虽然JVM规范把它描述成堆的逻辑一部分,但它还有个名字叫Non-heap(非堆),目的就是跟堆分开。 - 对于HotSpot虚拟机而言,很多开发者习惯把
方法区Method Area
描述成永久代Parmanent Gen
,但严格意义上两者不同,或者说使用永久代来实现方法区而已,永久代是方法区(相当于一个接口interface)的一个实现。 永久代Parmanent Gen
是一个常驻内存区域,用于存放JDK自身携带的Class,Interface的元数据,也就是说它存储运行环境必须的的类信息,被装进此区域的数据是不会被GC回收的,关闭JVM才会释放此区域占用的内存。
栈 、堆 、方法区交互关系
- 关系交互图
public class Person {
public void getHello(String name,int age) {
System.out.println(name + "说TA" + age + "了");
}
public static void main(String[] args) {
Person p1 = new Person();
p1.getHello("w",18);
Person p2 = new Person();
p2.getHello("s",24);
}
}
- 上述代码中,
Person p1 | Person p2
、18 | 24 | w | s
在栈中,属于栈的引用reference,以及本地变量 new Person() | new Person()
保存在堆中,开辟内存空间保存对象信息。- 而new Person() 、new Person()会在方法区开辟一块空间,保证Person这个类的结构信息
package com.test;
class Person {
private String name;
Person(String name) {
this.name = name;
}
public void setName(String name) {
this.name = name;
}
public String getName() {
return name;
}
}
public class TestValue {
public void getVal1(int age){
age = 30;
}
public void getVal2(Person person){
person.setName("xxx");
}
public void getVal3(String s){
s = "456";
}
public static void main(String[] args) {
TestValue value = new TestValue();
int age = 20;
value.getVal1(age);
System.out.println(age);
Person person =new Person("abc");
value.getVal2(person);
System.out.println(person.getName());
String x = "123";
value.getVal3(x);
System.out.println(x);
}
}
- 第一个打印,age数据保存在栈中的,虽然第一个getVal1方法中,修改了age,里面变的是栈中getVal1方法的变量,而出栈以后 回到main方法,这时候打印的还是mian这个栈里面的age值20
- 第二个打印,是引用类型,getVal2中修改了堆空间中Person这个对象的名字,这时候再打印就是修改过后的xxx
- 第三个打印,String字符串堆中常量池开辟空间创建了空间保存了'123',getVal3方法,再堆中创建了一个内存空间'456',指针指向了新的地址456,但是字符串x指向还是123