关闭
当前搜索:

编码中的setCharacterEncoding 理解

1、pageEncoding="UTF-8"的作用是设置JSP编译成Servlet时使用的编码。  2、contentType="text/html;charset=UTF-8"的作用是指定对服务器响应进行重新编码的编码。  3、request.setCharacterEncoding("UTF-8")的作用是设置对客户端请求进行重新编码的编码。 4、response.setCharacte...
阅读(1115) 评论(0)

JAVA利用apache的common-lang库转义HTML、SQL、Unicode

转义通常用在需要写入数据库的时候,经过转义可以避免很多潜在的问题,使系统更健壮。但是Java并没有自带相关类库。通常我们使用Apache开源的common-lang类库。 Apache common lang最新版下载地址:点击下载 [java] view plain copy import org.apache.commons.l...
阅读(449) 评论(0)

URIEncoding与useBodyEncodingForURI 在tomcat中文乱码处理上的区别及CharacterEncodingFilter(备忘)

大家知道tomcat5.0开始,对网页的中文字符的post或者get,经常会出现乱码现象。 具体是因为Tomcat默认是按ISO-8859-1进行URL解码,ISO-8859-1并未包括中文字符,这样的话中文字符肯定就不能被正确解析了。 常见的解决方法是在tomcat的server.xml下的connetor属性中增加URIEncoding或者useBodyEncodingForURI...
阅读(694) 评论(0)

ANSI编码和Unicode编码的不同

利用今天一天的时间,研究了一下ANSI编码和Unicode编码的不同,下面把我的研究成果写下来,以备 日后参考。 ANSI编码最常见的应用就是在Windows当中的记事本程序中,当新建一个记事本,默认的保存编码格式 就是ANSI,ANSI应该算是一种压缩编码了,当遇到标准的ASCII字符时,采用单字节表示,当遇到非标 准的ASCII字符(如中文)时,采用双字节表...
阅读(908) 评论(0)

JAVA方法 字符串与unicode的相互转换

unicode编码简而言之就是将每一个字符用16位2进制数标识。但是通常都用4位的16进制数标识。  例如:  1)中文字符串"你好"的unicode码为:\u60\u597d;  2)英文字符串"ab"的unicode码为:\u0061\u0062;  其中\u是标识unicode码用的,后面的4位16进制数则是对应字符的unicode码。  unicode码在J2EE项目中应用广...
阅读(45375) 评论(4)

字符,字节和编码

字符,字节和编码 [原创文章,转载请保留或注明出处:http://www.regexlab.com/zh/encoding.htm] 级别:中级 摘要:本文介绍了字符与编码的发展过程,相关概念的正确理解。举例说明了一些实际应用中,编码的实现方法。然后,本文讲述了通常对字符与编码的几种误解,由于这些误解而导致乱码产生的原因,以及消除乱码的办法。本文的内容涵盖了“中文问题”,“乱...
阅读(638) 评论(0)

Java_字符编码(Unicode、UTF-8、UTF-16)

首先看一下下面的程序(测试英文和中文在Unicode、UTF-8、UTF-16这三种编码下,一个字符占几个字节) [java] view plaincopy System.out.println("a(Unicode)    :" + "a".getBytes("Unicode").length);   System.out.println("...
阅读(808) 评论(0)

Unicode(UTF-8, UTF-16)令人混淆的概念

为啥需要Unicode         我们知道计算机其实挺笨的,它只认识0101这样的字符串,当然了我们看这样的01串时肯定会比较头晕的,所以很多时候为了描述简单都用十进制,十六进制,八进制表示.实际上都是等价的,没啥太多不一样.其他啥文字图片之类的其他东东计算机不认识.那为了在计算机上表示这些信息就必须转换成一些数字.你肯定不能想怎么转换就怎么转,必须得有定些规则.于是刚开始的时候...
阅读(796) 评论(0)

字符,字节和编码

字符,字节和编码 [原创文章,转载请保留或注明出处:http://www.regexlab.com/zh/encoding.htm] 级别:中级 摘要:本文介绍了字符与编码的发展过程,相关概念的正确理解。举例说明了一些实际应用中,编码的实现方法。然后,本文讲述了通常对字符与编码的几种误解,由于这些误解而导致乱码产生的原因,以及消除乱码的办法。本文的内容涵盖了“中文问题”,“乱...
阅读(575) 评论(0)

java字符编码转换研究(转)

1. 概述 本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。 在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF编码就是"e4b8ad e69687"。注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来"表示"。 2. 编码...
阅读(758) 评论(0)

字符集GBK和UTF8的区别说明

GBK就是在保存你的帖子的时候,一个汉字占用两个字节。。外国人看会出现乱码,此为我中华为自己汉字编码而形成之解决方案。 UTF8就是在保存你的帖子的时候,一个汉字占用3个字节。。但是外国人看的话不会乱码,此为西人为了解决多字节字符而形成之解决方案。 ASCII(ISO-8859-1)是鼻祖,最简单的方式,字节高位为0 GB2312、GBK、GB18030,这几个是中文编码方式,并向下...
阅读(727) 评论(0)

gb2312中的英文字母占几个字节?

GBK中字符是一个或者两个字节,单字节00–7F这个区间和ASCII是一样的;双字节字符的第一个字节在81-FE之间,通过这个可以判断是单字节还是双字节 byte[] bb="hello".getBytes("gb2312");     System.out.println("bb.length:::"+bb.length);     for(byte bb1:bb)     ...
阅读(1642) 评论(0)

关于java web中的解码与编码

一.html表单,用get和post提交信息到servlet   1.这个html标签里面的属性的是告诉浏览器的编码。个人觉得可以这样理解,你编写一个html文件,然后你在body里面输入了中文。这里的charset的值就是表明html制作使用的语言。那么当浏览器要显示这个html页面的时候,就知道这个页面是用什么字符显示了!就不会出现乱码了!还有一个作用就是页面编码!    比如这里...
阅读(792) 评论(0)

使用js对中文进行gbk编码

最近遇到一个问题,需要通过js来从一个utf-8编码的页面传递一个含中文的参数到另一个gbk编码的页面,直接使用js中的encodeURI等编码函数是不行的,他们都是使用utf-8编码参数,在GBK页面收到参数时就是乱码。在网上查了一下,找到一个用js实现的GBK编码的js组件,很小,挺方便的。在这里记录一下。 下载地址:http://download.csdn.net/detail/jdluo...
阅读(8647) 评论(1)

ASCII,Unicode和UTF-8 区别与联系

1. ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111。 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位...
阅读(585) 评论(0)
16条 共2页1 2 下一页 尾页
    个人资料
    • 访问:8552684次
    • 积分:72222
    • 等级:
    • 排名:第24名
    • 原创:258篇
    • 转载:2779篇
    • 译文:3篇
    • 评论:750条
    文章分类
    最新评论