开发工具分享
  • 首页
  • 计算科学
  • 文化旅游
  • 项目和网站
    • OSSEZ 计算技术
    • USRealEstate 社区
    • 地区文化
    • CWIKI.US
    • BUG.OSSEZ.COM
    • RSS.OSSEZ.COM
CWIKIUS.CN
一个有独立思考和温度的清新站
  1. Home
  2. Computer Science
  3. This article

缩小字符串( Compact String)和 压缩字符串(Compressed String)

2022年08月03日 674Browse 0Like 0Comments

正如我们在上面文章提到的内容,在英文语境中上面 2 个方法还是有区别的,在中文环境下主要表达就是字符串压缩。

 

java-9-featured-image

JDK 6 使用的压缩字符串方法,主要原因是我们修改了 String 的存储结构,char[] 在 Java 的很多地都会用到,并且 String 因为这个修改就只能接受使用 char[] 为参数的构造方法了。

在很多算法中,String 的操作又严重依赖 char[] 数组,如果我们进行这样修改的话,很多程序的代码都会需要跟着修改,这个显然是不划算的。

在后面我们使用的缩小字符串的处理方案来说也会有问题的,同样也会增加一些不少的问题,例如会导致一些方法修改为内部方法 intrinsified 同时一些 JIT compiler 编译的代码也需要进行改进。

因为存储方式的改变,也会有一些反人类的情况会出现:
LATIN-1 的 indexOf(String) 方法调用的是内部方法,但是 indexOf(char) 不是小的。

在 UTF-16 环境下,这 2 个方法都可以使用相同的内部方法,这个问题只会对 LATIN-1 字符集的 String 字符串有影响,并且也会在后续的版本中修正。

整体来说使用缩小字符串( Compact String)的效率更高一些。

你可以将 Java 应用程序的 Heap 内存空间 dump 出来后进行分析,针对 String 的改进不会对你应用程序的提高产生非常显著的影响,如果你的程序有很多逻辑上面的问题,修改程序上面的逻辑问题比考虑如何使用 String 要实际得多。

但是对 JVM 来说这种提高还是有必要的。

性能的不同

让我们通过下面的一个简单的测试来看看启用缩小字符串( Compact String)配置和不启用这个配置对性能产生的异同。

long startTime = System.currentTimeMillis();
 
List strings = IntStream.rangeClosed(1, 10_000_000)
  .mapToObj(Integer::toString) 
  .collect(toList());
 
long totalTime = System.currentTimeMillis() - startTime;
System.out.println(
  "Generated " + strings.size() + " strings in " + totalTime + " ms.");

startTime = System.currentTimeMillis();
 
String appended = (String) strings.stream()
  .limit(100_000)
  .reduce("", (l, r) -> l.toString() + r.toString());
 
totalTime = System.currentTimeMillis() - startTime;
System.out.println("Created string of length " + appended.length() 
  + " in " + totalTime + " ms.");

在这里,我们首先使用一个基本的方法来创建 1千万个 String 字符串,然后使用默认开启的配置来看看上面的代码的输出:

Generated 10000000 strings in 854 ms.
Created string of length 488895 in 5130 ms.

同样的,我们禁用 JVM 的这个参数 -XX:-CompactStrings 参数选项再来看看输出:

Generated 10000000 strings in 936 ms.
Created string of length 488895 in 9727 ms.

通过上面的代码,我们可以看到上面 2 个参数修改后对比的输出并不是非常的明显,但是也可以看到有明确的性能提升。

 

https://www.ossez.com/t/java-9-string/14024

Tags: None
Last updated:2022年08月03日

HoneyMoose

有温度的人文和独立的思考

Like
< Previous
Next >

Comments

Cancel reply

Archives
  • May 2026
  • April 2026
  • March 2026
  • February 2026
  • January 2026
  • December 2025
  • November 2025
  • October 2025
  • September 2025
  • August 2025
  • July 2025
  • June 2025
  • May 2025
  • April 2025
  • March 2025
  • February 2025
  • January 2025
  • December 2024
  • November 2024
  • October 2024
  • September 2024
  • August 2024
  • July 2024
  • June 2024
  • May 2024
  • April 2024
  • March 2024
  • February 2024
  • January 2024
  • December 2023
  • November 2023
  • October 2023
  • September 2023
  • August 2023
  • July 2023
  • June 2023
  • May 2023
  • April 2023
  • December 2022
  • November 2022
  • October 2022
  • September 2022
  • August 2022
  • May 2022
  • April 2022
  • March 2022
  • February 2022
  • January 2022
  • December 2021
  • November 2021
  • October 2021
  • September 2021
  • August 2021
  • July 2021
  • June 2021
  • May 2021
  • April 2021
  • March 2021
  • February 2021
  • January 2021
  • December 2020
  • November 2020
  • October 2020
  • September 2020
  • August 2020
  • July 2020
  • June 2020
  • May 2020
  • April 2020
  • March 2020
  • February 2020
  • January 2020
  • December 2019
  • November 2019
  • October 2019
  • September 2019
  • August 2019
  • July 2019
  • June 2019
  • May 2019
  • April 2019
  • March 2019
  • February 2019
  • January 2019
  • December 2018
  • November 2018
  • October 2018
  • September 2018
  • August 2018
  • July 2018
  • June 2018
  • May 2018
  • April 2018
  • March 2018
Categories
  • Computer Science (2,362)
    • Confluence (663)
    • Gradle (12)
  • U.S. (482)
  • 文化旅游 (145)

COPYRIGHT © 2020 CWIKIUS. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS

湘ICP备2020018253号-1