字符-->字节、字节-->字符时需要用到编码(Encoder)、解码(Decoder)
几种编码:
ASCII:总共128
ISO-8859-1:涵盖大部分西欧语言字符。一个字符一个字节表示
gbk2312:包含6000多的汉字,一个英文字符一个字节表示,一个汉子两个字节表示。
gbk:包含20000多个汉字,包含gbk2312所有编码。
utf-16:每个字符用两个字节表示。jvm的编码方式。效率最高
utf-8:英文用一个字节表示,汉字用三个字节表示。适合网络之间传输的编码方式。
URL的PathInfo用的utf-8,QueryString用的gbk,不同浏览器不同。
Servlet:
1.接收get方式,得到的是与页面编码方式一样的,但解码需要在服务器配置文件中修改。可以用一种不正常的方式解决,如String的构造函数,
new String(request.getParameter("name").getBytes("ISO-8859-1"),"utf-8")
2.接收post方式,可以设置request.setCharacterEncoding(arg)来设置解码方式(一定要在接收数据前设置),response.setCharacterEncoding(arg0)来设置编码方式
MySQL:
要与数据库的编码一致:url="jdbc:mysql://localhost:3306/DB?useUnicode=truecharacterEncoding=gbk"
JS:
默认编码是utf-8
常见问题:
1.中文变成看不懂的字符:gbk-->iso-8859-1
2.一个汉子变成一个问号:iso-8859-1-->iso-8859-1
3.一个汉子变成两个问号:gbk-->iso-8859-1-->gbk-->gbk
javaweb中文乱码问题
最新推荐文章于 2023-05-24 08:04:50 发布