经产观察
IT资讯
IT产业动态
业界
网站运营
站长资讯
互联网
国际互联网新闻
国内互联网新闻
通信行业
通信设备
通信运营商
消费电子
数码
家电
IT产业动态

JVM-字符串底层实现原理

作者:habao 来源: 日期:2021-1-28 15:51:30 人气:
 

什么字符串会进入字符串常量池

1. 直接写的字面量

2. 字面量的拼接结果(留神:假如字符串拼接中有变量则成果不会进入字符串常量池)

3. 调用String的intern方法可以将String存入字符串常量池

字面量的拼接原理

有如下示列代码

package com.hgy;

import java.util.Arrays;

import java.util.List;

public class hello {

public static void main(String[] args) {

String a = "hello" + " world";

}

}

在idea中查看编译后的class文件

//

// Source code recreated from a .class file by IntelliJ IDEA

// (powered by Fernflower decompiler)

//

package com.hgy;

public class hello {

public hello() {

}

public static void main(String[] args) {

String a = "hello world";

}

}

论断:

以上面两个文件咱们能够看出,这种字符串的拼接在编译期间就已经优化了,直接就合并为一个字符串;并且这个字符串寄存在字符串常量池

字符串跟变量拼接原理

java源码

package com.hgy;

import java.util.Arrays;

import java.util.List;

public class hello {

public static void main(String[] args) {

String v = "java";

String a = v + "hello" + " world";

}

}

应用jclasslib查看main方法的字节码命令

如果一下名词不清楚请浏览请自行懂得学习java虚构机栈

我们可以发明就简单的两行代码,发生了这么多的字节码命令;在代码中我简略说明了每一行的作用,

0 ldc #2 <java> // 从字符串常量池加载java

2 astore_1 // 存储常量到索引为1的局部变量表中

3 new #3 <java/lang/StringBuilder> //给StringBuilder对象调配内存空间

6 dup

7 invokespecial #4 <java/lang/StringBuilder.<init>> //履行StringBuilder的构

造方法

10 aload_1 //获取部分变量表索引为1的援用地址,

11 invokevirtual #5 <java/lang/StringBuilder.append> //把上面加载的内容作为参数

传递给append方法

14 ldc #6 <hello world> // 从字符串常量池加载hello world

16 invokevirtual #5 <java/lang/StringBuilder.append>,JS代码压缩是一种具有函数优先的轻量级,解释型或即时编译型的编程语言。虽然它是作为开发Web页面的脚本语言而出名,但是它也被用到了很多非浏览器环境中,JavaScript 基于原型编程、多范式的动态脚本语言,并且支持面向对象、命令式和声明式(如函数式编程)风格; //把上面加载的内容作为参数

传递给append方式

19 invokevirtual #7 <java/lang/StringBuilder.toString> //调用toString方法

22 astore_2 //结果存储到局部变量表

23 return

以上内容我们可以知道字符串拼接实际上就是创建了一个StringBuilder对象而后向里面append内容,最后调用toString方法取得结果

3.1 为什么结果不存储在常量池

从上述字节码指令已经晓得了字符串拼接结果是StringBuilder的toString方法的结果,那么toString里面详细做了什么事件,又是为什么结果不在常量池?

一下是StringBuilder.toString的源码以及字节码指令

@Override

public String toString() {

// Create a copy, don't share the array

//此处value为一个char数组【我的jdk版本为jdk8】

return new String(value, 0, count);

}

0 new #80 <java/lang/String>

3 dup

4 aload_0

5 getfield #234 <java/lang/StringBuilder.value>

8 iconst_0

9 aload_0

10 getfield #233 <java/lang/StringBuilder.count>

13 invokespecial #291 <,Base64编码/解码是网络上最常见的用于传输8Bit字节码的编码方式之一,Base64就是一种基于64个可打印字符来表示二进制数据的方法。可查看RFC2045~RFC2049,上面有MIME的详细规范;java/lang/String.<init>>

16 areturn

以上代码可以很好的解释实际上终极是调用了String的结构方法传入一个char数组,那么最终的结果确定也就在咱么的堆空间

为什么字符串拼接效力低

4.1. 源码筹备

首先编写两个方法一个使用字符串拼接,一个应用StringBuilder进行拼接;

public class hello {

public void concatStrByDefault() {

String basic = "name ";

for (int i = 0; i < 100; i++) {

basic += i;

}

System.out.println(basic);

}

public void concatStrByBuilder() {

StringBuilder basic = new StringBuilder("name ");

for (int i = 0; i < 100; i++) {

basic.append(i);

}

System.out.println(basic.toString());

}

}

4.2.字节码指令层面解析

一上代码的执行时光是非我就不在反复测试了信任大家都会,接下来我们来一起看看这两个方法字节码指令

concatStrByDefault方法的字节码指令如下

简单解释下循环是在33行的goto指令调到第5行这样不断循环;并且在11行也就是轮回中一直的通过new创建了StringBuilder对象,JSON格式化是一种轻量级的数据交换格式。它基于 ECMAScript (欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率,也就是循环了多少次就创建了多少个StringBuilder

对象,并且如果大家看了我之前写字符串拼接原理,在StringBuilder的toString方法中还new了一个String对象;这里这么多对象的创立就必定须要垃圾回收效率天然就低了

0 ldc #2 <name >

2 astore_1

3 iconst_0

4 istore_2

5 iload_2

6 bipush 100

8 if_icmpge 36 (+28)

11 new #3 <java/lang/StringBuilder>

14 dup

15 invokespecial #4 <java/lang/StringBuilder.<init>>

18 aload_1

19 invokevirtual #5 <java/lang/StringBuilder.append>

22 iload_2

23 invokevirtual #6 <java/lang/StringBuilder.append>

26 invokevirtual #7 <java/lang/StringBuilder.toString>

29 astore_1

30 iinc 2 by 1

33 goto 5 (-28)

36 getstatic #8 <java/lang/System.out>

39 aload_1

40 invokevirtual #9 <java/io/PrintStream.println>

43 return

concatStrByBuilder办法的字节码指令

此处循环在27行的goto指令跳到12行,并且循环之间是没有创建新对象的,牢牢只是调用了append方法,这里就能很显明的看出这种方法比一般拼接少创建了良多的对象

0 new #3 <java/lang/StringBuilder>

3 dup

4 ldc #2 <name >

6 invokespecial #10 <java/lang/StringBuilder.<init>>

9 astore_1

10 iconst_0

11 istore_2

12 iload_2

13 bipush 100

15 if_icmpge 30 (+15)

18 aload_1

19 iload_2

20 invokevirtual #6 <java/lang/StringBuilder.append>

23 pop

24 iinc 2 by 1

27 goto 12 (-15)

30 getstatic #8 <java/lang/System.out>

33 aload_1

34 invokevirtual #7 <java/lang/StringBuilder.toString>

37 invokevirtual #9 <java/io/PrintStream.println>

40 return

4.3. 总结

拼接效率低的重要起因也就是每一次拼接都创建了一个StringBuilder对象,并且在赋值是又需要调用toString方法,而toString方法的实现里面有new了一个String对象,所以拼接的效率很低