03 Java 字符串拼接

本文为个人学习摘要笔记。原文地址：羞，Java 字符串拼接竟然有这么多姿势

Java 字符串拼接常用有 6 种方式：

“+”号操作符
StringBuilder
StringBuffer
String 类的 concat 方法
String 类的 join 方法
StringUtils.join

“+”号操作符

举个栗子：

String chenmo = "沉默";
String wanger = "王二";

System.out.println(chenmo + wanger);

将这段代码使用反编译一下：

String chenmo = "\u6C89\u9ED8"; // 沉默
String wanger = "\u738B\u4E8C"; // 王二
System.out.println((new StringBuilder(String.valueOf(chenmo))).append(wanger).toString());

编译的时候把“+”号操作符替换成了 StringBuilder 的 append 方法。也就是说，“+”号操作符在拼接字符串的时候只是一种形式主义，让开发者使用起来比较简便，代码看起来比较简洁，读起来比较顺畅。算是 Java 的一种语法糖。

StringBuilder

先来看一下 StringBuilder 类的 append 方法的源码：

public StringBuilder append(String str) {
    super.append(str);
    return this;
}

父类 AbstractStringBuilder 的 append 方法：

public AbstractStringBuilder append(String str) {
    if (str == null)
        // 1.判断拼接的字符串是不是 null
        return appendNull();
    int len = str.length();
    // 2.判断是否需要扩容
    ensureCapacityInternal(count + len);
    // 3.将拼接的字符串复制到目标数组
    str.getChars(0, len, value, count);
    count += len;
    return this;
}

append 方法里有三步个操作：

判断拼接的字符串是不是 null，如果是，当做字符串“null”来处理。appendNull 方法实现。
拼接后的字符数组长度是否超过当前值，如果超过，进行扩容并复制。ensureCapacityInternal 方法实现。
将拼接的字符串 str 复制到目标数组 value 中。

appendNull 方法的源码如下：

private AbstractStringBuilder appendNull() {
    int c = count;
    ensureCapacityInternal(c + 4);
    final char[] value = this.value;
    value[c++] = 'n';
    value[c++] = 'u';
    value[c++] = 'l';
    value[c++] = 'l';
    count = c;
    return this;
}

ensureCapacityInternal 方法的源码如下：

private void ensureCapacityInternal(int minimumCapacity) {
    // overflow-conscious code
    if (minimumCapacity - value.length > 0) {
        value = Arrays.copyOf(value,
                newCapacity(minimumCapacity));
    }
}

StringBuffer

先有 StringBuffer 后有 StringBuilder，两者就像是孪生双胞胎，该有的都有，区别是StringBuffer 线程安全的。

public synchronized StringBuffer append(String str) {
    toStringCache = null;
    super.append(str);
    return this;
}

StringBuffer 类的 append 方法比 StringBuilder 多了一个关键字 synchronized。synchronized 是一种同步锁，它修饰的方法被称为同步方法，是线程安全的。

String 类的 concat 方法

单就姿势上来看，String 类的 concat 方法就好像 StringBuilder 类的 append。

String chenmo = "沉默";
String wanger = "王二";

System.out.println(chenmo.concat(wanger));

那它们之间究竟有多大的差别呢，以下举个栗子：

chenmo += wanger
chenmo = chenmo.concat(wanger)

其中 chenmo += wanger 实际上相当于 (new StringBuilder(String.valueOf(chenmo))).append(wanger).toString()。要探究“+”号操作符和 concat 之间的差别，实际上要看 append 方法和 concat 方法之间的差别。

查看 concat 方法的源码：

public String concat(String str) {
    int otherLen = str.length();
    // 1.如果拼接的字符串的长度为 0 则返回当之前字符串
    if (otherLen == 0) {
        return this;
    }
    int len = value.length;
    // 2.复制原字符串的字符数组
    char buf[] = Arrays.copyOf(value, len + otherLen);
    // 3.将拼接的字符串复制到目标数组
    str.getChars(buf, len);
    return new String(buf, true);
}

concat 方法里有三步个操作：

如果拼接的字符串的长度为 0，那么返回拼接前的字符串。
将原字符串的字符数组 value 复制到变量 buf 数组中。
把拼接的字符串 str 复制到字符数组 buf 中，并返回新的字符串对象。

综上可得结论：

如果拼接的字符串是 null，concat 时候就会抛出 NullPointerException，“+”号操作符会当做是“null”字符串来处理。
如果拼接的字符串是一个空字符串（”“），那么 concat 的效率要更高一点。毕竟不需要 new StringBuilder 对象。
如果拼接的字符串非常多，concat 的效率就会下降，因为创建的字符串对象越多，开销就越大。

String 类的 join 方法

JDK 1.8 提供了一种新的字符串拼接姿势：String 类增加了一个静态方法 join：

String chenmo = "沉默";
String wanger = "王二";
String cmower = String.join("", chenmo, wanger);

StringUtils.join

StringUtils.join 属于 org.apache.commons.lang3.StringUtils，使用方式：

String chenmo = "沉默";
String wanger = "王二";

StringUtils.join(chenmo, wanger);

该方法更善于拼接数组中的字符串，并且不用担心 NullPointerException：

StringUtils.join(null)            = null
StringUtils.join([])              = ""
StringUtils.join([null])          = ""
StringUtils.join(["a", "b", "c"]) = "abc"
StringUtils.join([null, "", "a"]) = "a"

其源码内部使用的仍然是 StringBuilder。

比较

阿里巴巴 Java 开发手册》上有一段内容说：循环体内，拼接字符串最好使用 StringBuilder 的 append 方法，而不是 + 号操作符。

举个栗子，在 for 循环中拼接字符串：

// 1. 使用 + 号拼接
String result = "";
for (int i = 0; i < 100000; i++) {
    result += "六六六";
}

// 2. 使用 append
StringBuilder sb = new StringBuilder();
for (int i = 0; i < 100000; i++) {
    sb.append("六六六");
}

实践结果第二段代码执行时间远比第一段代码要快得多，原因是第一段的 for 循环中创建了大量的 StringBuilder 对象，而第二段代码至始至终只有一个 StringBuilder 对象。

上一页02 函数式替代 for 循环下一页04 单例模式的几种实现

最后更新于3年前

这有帮助吗？