Java 分割字符串---按字节长度分割带有中文字符串,中文不乱码
中文在不同编码中占用的字节数是不同的,GBK编码中,一个汉字占两个字节,UTF-8编码格式中,一个汉字占3个字节。关于汉字所占字节,知乎有此问答,[url]http://www.zhihu.com/question/20451870[/url]。如果我们按照字节数来截取带中文的字符串,就有可能截取了半个或者三分之一个汉字,导致乱码的出现。[code="java"]package c...
原创
2015-05-17 00:14:15 ·
3062 阅读 ·
0 评论