java string中的比较难注意细节(intern,subString和gc回收String)

    jdk1.6后对字符串常量池做了改动,从源码到表现都做了很多改动。都是在规避了OOM的问题。下面说一些改动细节以及一些常见的错误认识。

subString的变动

1.6的实现如下

    public String substring(int beginIndex, int endIndex) {
        if (beginIndex < 0) {
            throw new StringIndexOutOfBoundsException(beginIndex);
        }
        if (endIndex > count) {
            throw new StringIndexOutOfBoundsException(endIndex);
        }
        if (beginIndex > endIndex) {
            throw new StringIndexOutOfBoundsException(endIndex - beginIndex);
        }
        return ((beginIndex == 0) && (endIndex == count)) ? this :
            new String(offset + beginIndex, endIndex - beginIndex, value);
    }

        这段代码逻辑没有问题,但是最后一句话改良了。问题出在这个String的构造方法上。

    String(int offset, int count, char value[]) {
        this.value = value;
        this.offset = offset;
        this.count = count;
    }

        这里直接把偏移量,长度和char数组都记录下来。当这执行subString的字符串被GC时,此时的char[]就内存泄露了。因为char数组多余的部分本来应该被回收的。

1.7直接使用了其他构造方法

    public String substring(int beginIndex) {
        if (beginIndex < 0) {
            throw new StringIndexOutOfBoundsException(beginIndex);
        }
        int subLen = value.length - beginIndex;
        if (subLen < 0) {
            throw new StringIndexOutOfBoundsException(subLen);
        }
        return (beginIndex == 0) ? this : new String(value, beginIndex, subLen);
    }

调用下面的构造方法

    public String(char value[], int offset, int count) {
        if (offset < 0) {
            throw new StringIndexOutOfBoundsException(offset);
        }
        if (count < 0) {
            throw new StringIndexOutOfBoundsException(count);
        }
        // Note: offset or count might be near -1>>>1.
        if (offset > value.length - count) {
            throw new StringIndexOutOfBoundsException(offset + count);
        }
        this.value = Arrays.copyOfRange(value, offset, offset+count);
    }

直接调用下面这个构造方法,直接执行了拷贝操作,虽然多了一部操作,同时也消除了内存泄露的问题。

    这个点是从葛一鸣老师的书中看到的。很符合这个专题,详细的还请看老师的书。

intern的变动

    具体的我原来在博客中写了,可以看

String的1.7变动:https://my.oschina.net/xpbob/blog/751405

String的1.6的表现以及场景问题:https://my.oschina.net/xpbob/blog/746488

    主要变动就是字符串常量池的位置发生了改变,由方法区转化到了堆中。intern返回的是堆中的第一次出现且intern的字符串的String对象。

    intern的操作最后参考SymbolTable.cpp中的intern方法,1.6和1.7都是这个。

String的gc

    这个细节是上intern的变动发现的。

    最开始我的理解是字符串常量基本不会被回收,只会随着类的回收而回收。事实情况不是这样的。

	public static void main(String[] args) {
		show();
		System.gc();
		show();

	}
	
	public static void show(){
		String s =new String(new char[]{'a','b'});
		System.out.println(System.identityHashCode(s));
		System.out.println(System.identityHashCode(s.intern()));
	}

    上面这段代码最好在jdk1.7以上执行,效果比较明显,你会发现,show方法中字符串ab和常量池中的ab的地址是一样的(这里说object是hashcode基本等同于地址,虽然事实并不是,只是和重写的hash来做区分),如果没有执行gc,那么结果都是常量池中的ab总会和第一次新建的ab的地址保持一致。

    最开始我以为是gc的时候from到to区域,所以地址变了,仔细调试看了唯一Id发现不是。

    intern的字符串被gc掉了。因为最初网上有用Intern来把字符串放入常量池来减少保证地址比较相同的做法。这个做法没什么问题。只是如果要保存地址值来做标识,那就会出问题了。

    回收的代码,1.6和1.7也是有点不同的。

    1.6的代码在SymbolTable.hpp中的unlink方法。

    1.7的代码在SymbolTable.cpp中的unlink方法。

    都是在gc执行的时候操作。只要没有堆栈对这个string持有引用,就可以被回收,这样就避免了太多的字符串加入到常量池中,把常量池所在的区域给oom了。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java ,`String.intern()` 是一个用于字符串对象的方法。它的作用是将字符串对象添加到字符串常量池,并返回常量池该字符串的引用。 具体含义如下: 1. 字符串常量池:Java 的字符串常量池是一个特殊的内存区域,用于存储字符串字面值。当创建字符串时,如果字符串常量池已经存在相同的字符串字面值,则会直接返回常量池的引用,而不会创建新的对象。 2. `String.intern()` 方法:`intern()` 方法是 `String` 类提供的一个实例方法。调用它会检查当前字符串对象在常量池是否存在。如果存在,则返回常量池的引用;如果不存在,则将当前字符串对象添加到常量池,并返回该引用。 使用 `String.intern()` 方法的主要目的是节省内存和提高性能。通过将字符串对象放入常量池,可以重复使用相同的字符串字面值,减少内存占用,并且可以更快地比较字符串的相等性。 例如: ```java String str1 = new String("Hello"); String str2 = str1.intern(); System.out.println(str1 == str2); // false System.out.println(str1.equals(str2)); // true ``` 在上面的例子,`str1` 是通过 `new String("Hello")` 创建的新字符串对象,而 `str2` 是通过 `str1.intern()` 返回的常量池的引用。虽然它们的值相等,但它们是不同的对象,所以 `str1 == str2` 返回 `false`,而 `str1.equals(str2)` 返回 `true`。 需要注意的是,`String.intern()` 方法可能会在某些情况下导致一些性能问题和潜在的内存泄漏。因此,在使用时要注意评估场景和潜在的影响。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值