乱码?烦死了到底是啥原因

java字符串统一用Unicode表示

这点先明确,那什么是Unicode呢,Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案,有人要问了,那ASCII 码和他什么关系,其实可以理解ASCII 码是编码鼻祖,外国人打的程序嘛,只有英文数字和特殊符号,所以ASCII 码只有128个,随着时间发展我们汉字拉丁文字等等等等,ASCII 码顶不住啊,于是就有了Unicode,Unicode编写的方式就是喜闻乐见的UTF-8了,在Unicode出现之前中国自个为汉字正名,编写了GBK,一般乱码就是GBK与UTF-8输入输出不同了,比如输入过来的是GBK,接受平台用的是UTF-8就乱码了,再底层一点,主要是字节读一半问题: 字节流若定义容器太小.,导致一个汉字只能保存一半,就会出现<?>,
(插一条小知识: UTF-8是动态编码,1-4个字节构成字符,GBK固定的,汉字2给字节,英文1个)
.

解决方法关键就是String的getBytes,可以API看看

1 乱码解决方法: 一般是GBK转UTF-8

利用getBytes(getBytes()默认使用GBK编码)将unicode字符串转成UTF-8格式的字节数组,然后用utf-8 对这个字节数组解码成新的字符串

new String( s.getBytes(“utf-8”) , “utf-8”);

UTF-8 转GBK原理也是一样
new String( s.getBytes(“GBK”) , “GBK”);

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值