java字符串编码深入_深入Java字符串

深入Java字符串

Java字符串类(java.lang.String)是Java中使用最多的类,也是最为特殊的一个类,很多时候,我们对它既熟悉又陌生。

一、从根本上认识java.lang.String类和String池

首先,我建议先看看String类的源码实现,这是从本质上认识String类的根本出发点。从中可以看到:

1、String类是final的,不可被继承。public final class String。

2、String类是的本质是字符数组char[], 并且其值不可改变。private final char value[];

然后打开String类的API文档,可以发现:

3、String类对象有个特殊的创建的方式,就是直接指定比如String x = "abc","abc"就表示一个字符串对象。而x是"abc"对象的地址,也叫做"abc"对象的引用。

4、String对象可以通过“+”串联。串联后会生成新的字符串。也可以通过concat()来串联,这个后面会讲述。

6、Java运行时会维护一个String Pool(String池),JavaDoc翻译很模糊“字符串缓冲区”。String池用来存放运行时中产生的各种字符串,并且池中的字符串的内容不重复。而一般对象不存在这个缓冲池,并且创建的对象仅仅存在于方法的堆栈区。下面是个系统内存示意图:

bfa07dbacaf8b9fd7b6c2aabbfc129ce.png

5、创建字符串的方式很多,归纳起来有三类:

其一,使用new关键字创建字符串,比如String s1 = new String("abc");

其二,直接指定。比如String s2 = "abc";

其三,使用串联生成新的字符串。比如String s3 = "ab" + "c";

二、String对象的创建

String对象的创建也很讲究,关键是要明白其原理。

原理1:当使用任何方式来创建一个字符串对象s时,Java运行时(运行中JVM)会拿着这个X在String池中找是否存在内容相同的字符串对象,如果不存在,则在池中创建一个字符串s,否则,不在池中添加。

原理2:Java中,只要使用new关键字来创建对象,则一定会(在堆区或栈区)创建一个新的对象。

原理3:使用直接指定或者使用纯字符串串联来创建String对象,则仅仅会检查维护String池中的字符串,池中没有就在池中创建一个,有则罢了!但绝不会在堆栈区再去创建该String对象。

原理4:使用包含变量的表达式来创建String对象,则不仅会检查维护String池,而且还会在堆栈区创建一个String对象。

另外,String的intern()方法是一个本地方法,定义为public native String intern(); intern()方法的价值在于让开发者能将注意力集中到String池上。当调用 intern 方法时,如果池已经包含一个等于此 String 对象的字符串(该对象由 equals(Object) 方法确定),则返回池中的字符串。否则,将此 String 对象添加到池中,并且返回此 String 对象的引用。

三、认识trim()、intern()和concat()、“+”。

三、认识空格、空串、null

下面看个例子:

/*** Created by IntelliJ IDEA.
* User: leizhimin
* Date: 2008-6-2 22:14:16
* Note: Please add comment here!*/publicclassStringTest {publicstaticvoidmain(String args[]) {//在池中和堆中分别创建String对象"abc",s1指向堆中对象

String s1 =newString("abc");//s2直接指向池中对象"abc"

String s2 ="abc";//在堆中新创建"abc"对象,s3指向该对象

String s3 =newString("abc");//在池中创建对象"ab" 和 "c",并且s4指向池中对象"abc"

String s4 ="ab"+"c";//c指向池中对象"c"

String c ="c";//在堆中创建新的对象"abc",并且s5指向该对象

String s5 ="ab"+ c;String s6 ="ab".concat("c");String s7 ="ab".concat(c);System.out.println("------------实串-----------");System.out.println(s1 == s2);//false

System.out.println(s1 == s3);//false

System.out.println(s2 == s3);//false

System.out.println(s2 == s4);//true

System.out.println(s2 == s5);//false

System.out.println(s2 == s6);//false

System.out.println(s2 == s7);//false

String b1 =newString("");String b2 = "";String b3 =newString("");String b4 = "".intern();String b5 ="" + "";String b6 ="".concat("");String b7 ="  ".trim();String b8 ="  ";String b9 ="    ".trim();System.out.println("------------空串-----------");System.out.println(b1 == b2);  //false

System.out.println(b1 == b3);  //false

System.out.println(b2 == b3);  //false

System.out.println(b2 == b4);  //true

System.out.println(b2 == b5);  //true*

System.out.println(b2 == b6);  //true*

System.out.println(b2 == b7);  //false*

System.out.println("-----a----");System.out.println(b2.equals(b7));  //true

System.out.println(b7 == b8);  //false

System.out.println(b7 == b9);  //false

System.out.println(b7.equals(b9));//true

System.out.println(b9 ==null);//false

System.out.println("b8.trim():");for(byteb : b8.getBytes()) {System.out.print(">>>"+ (int) b +" ");}System.out.println("\nb8.trim():");for(byteb : b8.trim().getBytes()) {System.out.print(">>>"+ (int) b +" ");}System.out.println("\nb9.trim():");for(byteb : b9.trim().getBytes()) {System.out.print(">>>"+ (int) b +" ");}}}

四、String的常见用法

1、字符串重编码

这个问题说来比较简单,转码就一行搞定,不信你看看,但究竟为什么要转码,是个很深奥的问题,看例子:

importjava.io.UnsupportedEncodingException;/*** 字符串转码测试** @author leizhimin 2009-7-17 10:50:06*/publicclassTestEncoding {publicstaticvoidmain(String[] args)throwsUnsupportedEncodingException {System.out.println("转码前,输出Java系统属性如下:");System.out.println("user.country:"+ System.getProperty("user.country"));System.out.println("user.language:"+ System.getProperty("user.language"));System.out.println("sun.jnu.encoding:"+ System.getProperty("sun.jnu.encoding"));System.out.println("file.encoding:"+ System.getProperty("file.encoding"));System.out.println("---------------");String s ="熔岩博客";String s1 =newString(s.getBytes(),"UTF-8");String s2 =newString(s.getBytes("UTF-8"),"UTF-8");String s3 =newString(s.getBytes("UTF-8"));String s4 =newString(s.getBytes("UTF-8"),"GBK");String s5 =newString(s.getBytes("GBK"));String s6 =newString(s.getBytes("GBK"),"GBK");System.out.println(s1);System.out.println(s2);System.out.println(s3);System.out.println(s4);System.out.println(s5);System.out.println(s6);}}

输出结果:

转码前,输出Java系统属性如下:user.country:CNuser.language:zhsun.jnu.encoding:GBKfile.encoding:UTF-8---------------熔岩博客熔岩博客熔岩博客鐔斿博鍗氬���Ҳ���熔岩博客Process finished with exit code 0

得出一结论:

a、转一个码,又用该码来构建一个字符串,是绝对不会出现乱码的,----你相当于没转。

b、转码与否,与字符串本身编码有关,字符串本身的编码与谁有关?----文件编码,或者你的IDE设置的编码有关。

在此,我用的IDEA开发工具,默认是UTF-8编码,但操作系统使用的是GBK,但没有问题,我只要按照UTF-8来读取我的字符串就不会有乱码。但是文件已经是UTF-8了,你非要转为GBK,不乱才怪!那有什么办法呢?在Windows下,用记事本或者Editplus打开后另存为(并修改编码方式即可)。

200907171247801310703.png

至于已经要从UFT-8转换为GBK,这就要靠内码转换工具了,是个比较复杂的问题,如果有谁想研究可以告诉我,一块研究研究。

2、字符比较

不就是个匹配关系吗?String类的API有一些可以做比较,如果不行,可以寻求正则表达式来解决。

3、获取某个字符

获取一个字符序列toCharArray(),然后就随便玩去吧,中文就乱了。

4、字符串的截取

5、字符串的替换与查找

6、开始结束判断

startsWith()/endWith()

7、字符串的排序比较

compareTo(String anotherString)按字典顺序比较两个字符串。compareToIgnoreCase(String str)不考虑大小写,按字典顺序比较两个字符串。

8、字符串的equals()和hashCode()

已经实现了好了,直接调用,不用重写

9、字符串的类型转化

太多了,String.valueOf()系列很多。

10、字符串的复制

11、大小写转换

13、正则匹配

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Java字符串编码转换的工具类可以通过使用Java自带的Charset类和String类的getBytes()方法来实现。下面是一个示例的工具类: ```java import java.nio.charset.Charset; public class EncodingUtils { // 将指定编码字符串转换为默认编码字符串 public static String convertToDefaultEncoding(String str, String sourceEncoding) { byte[] bytes = str.getBytes(Charset.forName(sourceEncoding)); return new String(bytes); } // 将默认编码字符串转换为指定编码字符串 public static String convertToEncoding(String str, String targetEncoding) { byte[] bytes = str.getBytes(); return new String(bytes, Charset.forName(targetEncoding)); } } ``` 使用示例: ```java public class Main { public static void main(String[] args) { String str1 = "字符串"; // 将UTF-8编码字符串转换为默认编码字符串 String defaultEncodingStr = EncodingUtils.convertToDefaultEncoding(str1, "UTF-8"); System.out.println("Default Encoding: " + defaultEncodingStr); // 将默认编码字符串转换为GBK编码字符串 String targetEncodingStr = EncodingUtils.convertToEncoding(defaultEncodingStr, "GBK"); System.out.println("Target Encoding: " + targetEncodingStr); } } ``` 在上述示例,工具类`EncodingUtils`提供了两个静态方法。`convertToDefaultEncoding()`方法将指定编码字符串转换为默认编码字符串,而`convertToEncoding()`方法将默认编码字符串转换为指定编码字符串。 ### 回答2: Java字符串编码转换工具类是一种用于处理字符串编码转换的工具类,它可以将字符串从一种字符编码转换为另一种字符编码。在Java字符串编码可以使用标准的UTF-8、UTF-16、ISO-8859-1等编码方式。 这个工具类通常提供以下几种方法: 1. `toUTF8(String str)`:将字符串从其他编码转换为UTF-8编码。 2. `fromUTF8(String str)`:将UTF-8编码字符串转换为其他编码。 3. `toISO88591(String str)`:将字符串从其他编码转换为ISO-8859-1编码。 4. `fromISO88591(String str)`:将ISO-8859-1编码字符串转换为其他编码。 使用这个工具类可以避免在转换编码时出现乱码或者字符串不可识别的问题。例如,当我们从外部资源读取数据时,如果字符串编码与程序默认字符编码不一致,就会导致乱码,这时可以使用这个工具类进行编码转换。 在实现这个工具类时,可以使用Java提供的相关类库,如`java.nio.charset.Charset`、`java.nio.CharBuffer`等类来进行编码转换操作。首先,通过指定源编码和目标编码,创建`Charset`对象;然后,使用`encode`方法将源字符串编码成字节序列,并使用目标`Charset`对象的`decode`方法将字节序列解码成目标编码字符串。 使用这个工具类时,需要注意的是源编码和目标编码必须是支持的字符编码,否则会抛出编码不支持的异常。此外,还应该注意对输入的异常情况进行处理,例如空字符串或空指针异常,以确保程序的健壮性。 总之,Java字符串编码转换工具类是一个方便实用的工具,可以帮助我们在不同编码间进行转换,避免乱码的问题,提高程序的稳定性和可靠性。 ### 回答3: Java提供了许多内置的工具类来方便字符串编码转换。其最常用的工具类是`java.nio.charset.Charset`和`java.lang.String`类。 首先,`Charset`类包含了许多常见的字符集,比如UTF-8、GBK、ISO-8859-1等。我们可以使用`Charset.forName(String charsetName)`方法来获取指定字符集的一个实例。 接下来,`String`类提供了几个方法来进行字符串编码转换。其最常用的是`getBytes(String charsetName)`方法,它将字符串按照指定的字符集转换为字节数组。例如,如果我们想将字符串转换为UTF-8编码的字节数组,可以使用`getBytes("UTF-8")`方法。 除了将字符串转换为字节数组,`String`类还提供了`getBytes()`方法,它将字符串按照默认的字符集转换为字节数组。默认的字符集可以通过调用`Charset.defaultCharset()`方法获取。 另外,如果我们想将字节数组转换为字符串,可以使用`String`类的构造方法`String(byte[] bytes, Charset charset)`。该构造方法将字节数组按照指定的字符集转换为字符串。 除了上述的方法,还有一些其他的工具类可以辅助字符串编码转换。比如,`java.io.InputStreamReader`和`java.io.OutputStreamWriter`类提供了将字节流与字符流进行转换的功能。 总结来说,Java提供了丰富的工具类来进行字符串编码转换。我们可以通过`Charset`类获取指定字符集的实例,通过`String`类的相关方法来进行字符串与字节数组之间的转换。另外,还可以使用`java.io.InputStreamReader`和`java.io.OutputStreamWriter`类进行字节流与字符流之间的转换。这些工具类的使用可以方便地实现字符串编码转换的需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值