编码处理
文章平均质量分 87
OkidoGreen
这个作者很懒,什么都没留下…
展开
-
“锟斤拷”的前世今生
不管是在工作中还是生活中,相信很多同学都被“锟斤拷”深深的毒害过,比如这样,这样,还有这样,那么究竟是为什么会出现这些奇怪的字符?接下来我们一探究竟!转载 2024-04-12 08:41:15 · 685 阅读 · 0 评论 -
URIEncoding与useBodyEncodingForURI 在tomcat中文乱码处理上的区别及CharacterEncodingFilter(备忘)
大家知道tomcat5.0开始,对网页的中文字符的post或者get,经常会出现乱码现象。具体是因为Tomcat默认是按ISO-8859-1进行URL解码,ISO-8859-1并未包括中文字符,这样的话中文字符肯定就不能被正确解析了。常见的解决方法是在tomcat的server.xml下的connetor属性中增加URIEncoding或者useBodyEncodingForURI转载 2016-02-22 19:33:26 · 1729 阅读 · 0 评论 -
JAVA利用apache的common-lang库转义HTML、SQL、Unicode
转义通常用在需要写入数据库的时候,经过转义可以避免很多潜在的问题,使系统更健壮。但是Java并没有自带相关类库。通常我们使用Apache开源的common-lang类库。Apache common lang最新版下载地址:点击下载[java] view plain copyimport org.apache.commons.l转载 2016-11-24 14:32:25 · 2107 阅读 · 0 评论 -
编码中的setCharacterEncoding 理解
1、pageEncoding="UTF-8"的作用是设置JSP编译成Servlet时使用的编码。 2、contentType="text/html;charset=UTF-8"的作用是指定对服务器响应进行重新编码的编码。 3、request.setCharacterEncoding("UTF-8")的作用是设置对客户端请求进行重新编码的编码。4、response.setCharacte转载 2016-12-14 11:42:39 · 2915 阅读 · 0 评论 -
JAVA方法 字符串与unicode的相互转换
unicode编码简而言之就是将每一个字符用16位2进制数标识。但是通常都用4位的16进制数标识。 例如: 1)中文字符串"你好"的unicode码为:\u60\u597d; 2)英文字符串"ab"的unicode码为:\u0061\u0062; 其中\u是标识unicode码用的,后面的4位16进制数则是对应字符的unicode码。 unicode码在J2EE项目中应用广转载 2014-05-13 21:43:36 · 69338 阅读 · 6 评论 -
Unicode 和 UTF-8 有何区别?
作者:于洋链接:https://www.zhihu.com/question/23374078/answer/69732605来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们看到8个开关状态是好的,于是他们把这称为”字节“。再后来,他们又做了一些可转载 2018-01-31 14:25:06 · 671 阅读 · 0 评论 -
[JavaMail]10 详解字符编码和MimeUtility,URLDecoder,URLEncoder
一、邮件中的编码1. Message的headerMessage中的header都是只能存放ASCII码的,当邮件中有非ASCII时,例如邮件的主题是中文时,我们可以把邮件的中文主题以UTF-8(当然也可以使用其它编码,如GB2312)规则来进行编码,并以指定格式的ASCII字符串来表示。若邮件的主题是“中”,我们想用UTF-8编码。那么“中”字的UTF-8的编码是E4 B转载 2018-02-02 14:21:59 · 8971 阅读 · 0 评论 -
关于 -128 ,+128,-0,+0,-1 的反码补码
一.反码的范围反码表示法规定:正数的反码与其原码相同。负数的反码是对其原码逐位取反,但符号位除外。在规定中,8位二进制码能表示的反码范围是-127~127。-128没有反码。那么,为什么规定-128没有反码呢?下面解释。首先看-0,[-0]原码=1000 000,其中1是符号位,根据反码规定,算出[-0]反码=1111 1111,再看-128,[-1转载 2018-02-27 13:37:18 · 11973 阅读 · 4 评论 -
commons-codec使用介绍
https://blog.csdn.net/jianggujin/article/details/51149133 commons-codec是Apache开源组织提供的用于摘要运算、编码的包。在该包中主要分为四类加密:BinaryEncoders、DigestEncoders、LanguageEncoders、NetworkEncoders。今天就为大家介绍一下如何用commons-...转载 2018-08-03 12:22:15 · 12067 阅读 · 0 评论 -
关于java web中的解码与编码
一.html表单,用get和post提交信息到servlet 1.这个html标签里面的属性的是告诉浏览器的编码。个人觉得可以这样理解,你编写一个html文件,然后你在body里面输入了中文。这里的charset的值就是表明html制作使用的语言。那么当浏览器要显示这个html页面的时候,就知道这个页面是用什么字符显示了!就不会出现乱码了!还有一个作用就是页面编码! 比如这里转载 2014-02-10 20:16:05 · 1522 阅读 · 0 评论 -
gb2312中的英文字母占几个字节?
GBK中字符是一个或者两个字节,单字节00–7F这个区间和ASCII是一样的;双字节字符的第一个字节在81-FE之间,通过这个可以判断是单字节还是双字节byte[] bb="hello".getBytes("gb2312"); System.out.println("bb.length:::"+bb.length); for(byte bb1:bb)转载 2014-02-21 11:17:52 · 5871 阅读 · 0 评论 -
字符集GBK和UTF8的区别说明
GBK就是在保存你的帖子的时候,一个汉字占用两个字节。。外国人看会出现乱码,此为我中华为自己汉字编码而形成之解决方案。UTF8就是在保存你的帖子的时候,一个汉字占用3个字节。。但是外国人看的话不会乱码,此为西人为了解决多字节字符而形成之解决方案。ASCII(ISO-8859-1)是鼻祖,最简单的方式,字节高位为0GB2312、GBK、GB18030,这几个是中文编码方式,并向下转载 2014-02-21 11:18:54 · 1578 阅读 · 0 评论 -
使用js对中文进行gbk编码
最近遇到一个问题,需要通过js来从一个utf-8编码的页面传递一个含中文的参数到另一个gbk编码的页面,直接使用js中的encodeURI等编码函数是不行的,他们都是使用utf-8编码参数,在GBK页面收到参数时就是乱码。在网上查了一下,找到一个用js实现的GBK编码的js组件,很小,挺方便的。在这里记录一下。下载地址:http://download.csdn.net/detail/jdluo转载 2013-02-09 11:29:54 · 16712 阅读 · 2 评论 -
ASCII,Unicode和UTF-8 区别与联系
1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111。上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位转载 2013-02-05 16:36:08 · 1324 阅读 · 0 评论 -
字符,字节和编码
字符,字节和编码[原创文章,转载请保留或注明出处:http://www.regexlab.com/zh/encoding.htm]级别:中级摘要:本文介绍了字符与编码的发展过程,相关概念的正确理解。举例说明了一些实际应用中,编码的实现方法。然后,本文讲述了通常对字符与编码的几种误解,由于这些误解而导致乱码产生的原因,以及消除乱码的办法。本文的内容涵盖了“中文问题”,“乱转载 2014-05-13 21:38:10 · 1248 阅读 · 0 评论 -
Unicode(UTF-8, UTF-16)令人混淆的概念
为啥需要Unicode 我们知道计算机其实挺笨的,它只认识0101这样的字符串,当然了我们看这样的01串时肯定会比较头晕的,所以很多时候为了描述简单都用十进制,十六进制,八进制表示.实际上都是等价的,没啥太多不一样.其他啥文字图片之类的其他东东计算机不认识.那为了在计算机上表示这些信息就必须转换成一些数字.你肯定不能想怎么转换就怎么转,必须得有定些规则.于是刚开始的时候转载 2014-05-13 21:32:31 · 1572 阅读 · 1 评论 -
字符,字节和编码
字符,字节和编码[原创文章,转载请保留或注明出处:http://www.regexlab.com/zh/encoding.htm]级别:中级摘要:本文介绍了字符与编码的发展过程,相关概念的正确理解。举例说明了一些实际应用中,编码的实现方法。然后,本文讲述了通常对字符与编码的几种误解,由于这些误解而导致乱码产生的原因,以及消除乱码的办法。本文的内容涵盖了“中文问题”,“乱转载 2014-05-13 21:16:37 · 1162 阅读 · 0 评论 -
Java_字符编码(Unicode、UTF-8、UTF-16)
首先看一下下面的程序(测试英文和中文在Unicode、UTF-8、UTF-16这三种编码下,一个字符占几个字节)[java] view plaincopySystem.out.println("a(Unicode) :" + "a".getBytes("Unicode").length); System.out.println("转载 2014-05-13 21:36:21 · 1950 阅读 · 0 评论 -
java字符编码转换研究(转)
1. 概述本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF编码就是"e4b8ad e69687"。注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来"表示"。2. 编码转载 2014-05-13 21:10:23 · 1519 阅读 · 0 评论 -
ANSI编码和Unicode编码的不同
利用今天一天的时间,研究了一下ANSI编码和Unicode编码的不同,下面把我的研究成果写下来,以备日后参考。ANSI编码最常见的应用就是在Windows当中的记事本程序中,当新建一个记事本,默认的保存编码格式就是ANSI,ANSI应该算是一种压缩编码了,当遇到标准的ASCII字符时,采用单字节表示,当遇到非标准的ASCII字符(如中文)时,采用双字节表转载 2014-05-14 06:02:07 · 1785 阅读 · 0 评论 -
深入分析 Java 中的中文编码问题
转载地址:http://www.ibm.com/developerworks/cn/java/j-lo-chinesecoding/几种常见的编码格式为什么要编码不知道大家有没有想过一个问题,那就是为什么要编码?我们能不能不编码?要回答这个问题必须要回到计算机是如何表示我们人类能够理解的符号的,这些符号也就是我们人类使用的语言。由于人类的语言有太多,因而表示这些转载 2012-12-13 16:15:07 · 1337 阅读 · 0 评论