[Charset]UTF-8, UTF-16, UTF-16LE, UTF-16BE的区别

最新推荐文章于 2022-07-25 17:08:51 发布

m540920181

最新推荐文章于 2022-07-25 17:08:51 发布

阅读量1.6k

点赞数

分类专栏：编码问题文章标签： servlet 服务器浏览器 java 应用服务器 windows

本文链接：https://blog.csdn.net/m540920181/article/details/7966390

版权

本文讲述了在HTTP请求过程中，UTF-8、UTF-16LE和UTF-16BE编码的使用与问题。讨论了浏览器、Servlet服务器和应用服务器之间的编码转换，强调了HttpServletRequest.setCharacterEncoding()仅影响POST请求的编码，并探讨了不同服务器（如Weblogic、Tomcat和Jboss）中ContextPath的配置。

摘要由CSDN通过智能技术生成

今天遇到的麻烦事，好久没有使用servelt类了，今天偶感，就使用了，在报错之后在jsp中设置的编码形式是：<%@ page language="java" import="java.util.*" pageEncoding="GBK" contentType="text/html; charset=GBK"%> <meta http-equiv="Content-type" content="text/html;charset=UTF-8" />

在servlet中设置的是：response.setContentType("text/html;charset=UTF-8");
request.setCharacterEncoding("UTF-8");

结果后台报的错误还是：xml的格式为utf-16ln , 不能转换为utf-8

我就纳闷了，我有没有使用xml格式的数据，而且每个页面到使用编码统一，没办法，就是不通过，最后把编码都去掉了，呵呵，查到数据了，汗啊。

然后，我有把每个页面的编码重新统一了，狂汗，又查到数据了。同时也查看了一些编码，如下：

charset里的问题, 一般我们都用unicode来作为统一编码, 但unicode也有多种表现形式

首先, 我们说的unicode, 其实就是utf-16, 但最通用的却是utf-8,
原因: 我猜大概是英文占的比例比较大, 这样utf-8的存储优势比较明显, 因为utf-16是固定16位的(双字节), 而utf-8则是看情况而定, 即可变长度, 常规的128个ASCII只需要8位(单字节), 而汉字需要24位

UTF-16, UTF-16LE, UTF-16BE, 及其区别BOM
同样都是unicode, 为什么要搞3种这么麻烦?
先说UTF-16BE (big endian), 比较好理解的, 俗称大头
比如说char 'a', ascii为

最低0.47元/天解锁文章

m540920181

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[Charset]UTF-8, UTF-16, UTF-16LE, UTF-16BE的区别

今天遇到的麻烦事，好久没有使用servelt类了，今天偶感，就使用了，在报错之后在jsp中设置的编码形式是：<%@ page language="java" import="java.util.*" pageEncoding="GBK" contentType="text/html; charset=GBK"%> 在servlet中设置的是：response.setContentType
复制链接

扫一扫