03 Java 字符串拼接

本文为个人学习摘要笔记。 原文地址:羞,Java 字符串拼接竟然有这么多姿势

Java 字符串拼接常用有 6 种方式:

  1. “+”号操作符

  2. StringBuilder

  3. StringBuffer

  4. String 类的 concat 方法

  5. String 类的 join 方法

  6. StringUtils.join

“+”号操作符

举个栗子:

String chenmo = "沉默";
String wanger = "王二";
System.out.println(chenmo + wanger);

将这段代码使用反编译一下:

String chenmo = "\u6C89\u9ED8"; // 沉默
String wanger = "\u738B\u4E8C"; // 王二
System.out.println((new StringBuilder(String.valueOf(chenmo))).append(wanger).toString());

编译的时候把“+”号操作符替换成了 StringBuilderappend 方法。也就是说,“+”号操作符在拼接字符串的时候只是一种形式主义,让开发者使用起来比较简便,代码看起来比较简洁,读起来比较顺畅。算是 Java 的一种语法糖。

StringBuilder

先来看一下 StringBuilder 类的 append 方法的源码:

public StringBuilder append(String str) {
super.append(str);
return this;
}

父类 AbstractStringBuilderappend 方法:

public AbstractStringBuilder append(String str) {
if (str == null)
// 1.判断拼接的字符串是不是 null
return appendNull();
int len = str.length();
// 2.判断是否需要扩容
ensureCapacityInternal(count + len);
// 3.将拼接的字符串复制到目标数组
str.getChars(0, len, value, count);
count += len;
return this;
}

append 方法里有三步个操作:

  1. 判断拼接的字符串是不是 null,如果是,当做字符串“null”来处理。appendNull 方法实现。

  2. 拼接后的字符数组长度是否超过当前值,如果超过,进行扩容并复制。ensureCapacityInternal 方法实现。

  3. 将拼接的字符串 str 复制到目标数组 value 中。

appendNull 方法的源码如下:

private AbstractStringBuilder appendNull() {
int c = count;
ensureCapacityInternal(c + 4);
final char[] value = this.value;
value[c++] = 'n';
value[c++] = 'u';
value[c++] = 'l';
value[c++] = 'l';
count = c;
return this;
}

ensureCapacityInternal 方法的源码如下:

private void ensureCapacityInternal(int minimumCapacity) {
// overflow-conscious code
if (minimumCapacity - value.length > 0) {
value = Arrays.copyOf(value,
newCapacity(minimumCapacity));
}
}

StringBuffer

先有 StringBuffer 后有 StringBuilder,两者就像是孪生双胞胎,该有的都有,区别是StringBuffer 线程安全的

public synchronized StringBuffer append(String str) {
toStringCache = null;
super.append(str);
return this;
}

StringBuffer 类的 append 方法比 StringBuilder 多了一个关键字 synchronizedsynchronized 是一种同步锁,它修饰的方法被称为同步方法,是线程安全的。

String 类的 concat 方法

单就姿势上来看,String 类的 concat 方法就好像 StringBuilder 类的 append

String chenmo = "沉默";
String wanger = "王二";
System.out.println(chenmo.concat(wanger));

那它们之间究竟有多大的差别呢,以下举个栗子:

chenmo += wanger
chenmo = chenmo.concat(wanger)

其中 chenmo += wanger 实际上相当于 (new StringBuilder(String.valueOf(chenmo))).append(wanger).toString()。要探究“+”号操作符和 concat 之间的差别,实际上要看 append 方法和 concat 方法之间的差别。

查看 concat 方法的源码:

public String concat(String str) {
int otherLen = str.length();
// 1.如果拼接的字符串的长度为 0 则返回当之前字符串
if (otherLen == 0) {
return this;
}
int len = value.length;
// 2.复制原字符串的字符数组
char buf[] = Arrays.copyOf(value, len + otherLen);
// 3.将拼接的字符串复制到目标数组
str.getChars(buf, len);
return new String(buf, true);
}

concat 方法里有三步个操作:

  1. 如果拼接的字符串的长度为 0,那么返回拼接前的字符串。

  2. 将原字符串的字符数组 value 复制到变量 buf 数组中。

  3. 把拼接的字符串 str 复制到字符数组 buf 中,并返回新的字符串对象。

综上可得结论:

  1. 如果拼接的字符串是 null,concat 时候就会抛出 NullPointerException,“+”号操作符会当做是“null”字符串来处理。

  2. 如果拼接的字符串是一个空字符串(”“),那么 concat 的效率要更高一点。毕竟不需要 new StringBuilder 对象。

  3. 如果拼接的字符串非常多,concat 的效率就会下降,因为创建的字符串对象越多,开销就越大。

String 类的 join 方法

JDK 1.8 提供了一种新的字符串拼接姿势:String 类增加了一个静态方法 join

String chenmo = "沉默";
String wanger = "王二";
String cmower = String.join("", chenmo, wanger);

StringUtils.join

StringUtils.join 属于 org.apache.commons.lang3.StringUtils,使用方式:

String chenmo = "沉默";
String wanger = "王二";
StringUtils.join(chenmo, wanger);

该方法更善于拼接数组中的字符串,并且不用担心 NullPointerException

StringUtils.join(null) = null
StringUtils.join([]) = ""
StringUtils.join([null]) = ""
StringUtils.join(["a", "b", "c"]) = "abc"
StringUtils.join([null, "", "a"]) = "a"

其源码内部使用的仍然是 StringBuilder

比较

阿里巴巴 Java 开发手册》上有一段内容说:循环体内,拼接字符串最好使用 StringBuilderappend 方法,而不是 + 号操作符。

举个栗子,在 for 循环中拼接字符串:

// 1. 使用 + 号拼接
String result = "";
for (int i = 0; i < 100000; i++) {
result += "六六六";
}
// 2. 使用 append
StringBuilder sb = new StringBuilder();
for (int i = 0; i < 100000; i++) {
sb.append("六六六");
}

实践结果第二段代码执行时间远比第一段代码要快得多,原因是第一段的 for 循环中创建了大量的 StringBuilder 对象,而第二段代码至始至终只有一个 StringBuilder 对象。