汉字问题 UTF-8编码乱码如何实现汉字转化

最新推荐文章于 2024-05-27 17:40:49 发布

yuhua3272004

最新推荐文章于 2024-05-27 17:40:49 发布

阅读量9.5k

点赞数

分类专栏： jsp 文章标签： application 工具 encoding html java function

jsp 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

如何实现汉字转化
　
如果要支持国际化,那么页面的编码必须为UTF-8,因为客户端的浏览器都支持UTF-8编码。
下面做个简单的测试：
建立一个html文件，内容很简单，如下

Java代码

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
</HEAD>
<BODY>
这是一个中文字符串<BR>
这是一个中文字符串
</BODY>
</HTML>

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
</HEAD>
<BODY>
这是一个中文字符串<BR>
这是一个中文字符串
</BODY>
</HTML>

以上代码保存后，在IE中打开，你可以看到
这是一个中文字符串
Β???
第二行显示的可能不同机器显示不一样，但是应该都是乱码。
下面进行第二步，返回刚才的页面，修改浏览器的编码方式，可以看得到
无论怎么改变编码方式，第一行永远现实的是“这是一个中文字符串”，只有在编码方式为简体中文的时候，第二行才不显示乱码。
所以，如果要你的web站点支持国际化，那么除了编码方式要为UTF-8，而且页面中的中文部分（包括中文的标点符号）都要经过UNICODE编码。
UTF-8编码工具：
方法一： JDK的native2ascii工具

native2ascii-本地码-至-ASCII 码转换器

将含有本地编码字符（既非 Latin1 又非 Unicode 字符）的文件转换为 Unicode 编码字符的文件。

结构
native2ascii [options] [inputfile [outputfile]]

说明
Java 编译器和其它 Java 工具只能处理含有 Latin-1 和/或 Unicode 编码（/udddd 记号）字符的文件。native2ascii 将含有其它字符编码的文件转换成含 Latin-1 和/或 Unicode 编码字符的文件。

若省略 outputfile，则使用标准输出设备输出。此外，如果也省略 inputfile，则使用标准输入设备输入。

选项
-reverse
执行相反的操作：将含 Latin-1 和/或 Unicode 编码字符的文件转换成含本地编码字符的文件：

-encoding encoding_name
指定转换过程使用的编码名称。缺省的编码从系统属性 file.encoding 中得到。encoding_name 字符串必须是符合要求的字符串。

比如可以这样利用native2ascii：
native2ascii -encoding gbk application_zh_CN.properties temp.properties
这里将根据application_zh_CN.properties输出了一个临时文件temp.properties，然后把application_zh_CN.properties中的文件内容替换为这个临时文件的内容就可以了。

转换后的application_zh_CN.properties

Java代码

# Hello/u5b9e/u4f8b/u4f7f/u7528/u7684/u8d44/u6e90/u6587/u4ef6
hello.title=/u7b2c/u4e00/u4e2aStruts/u5e94/u7528
hello.prompt.user=/u8bf7/u8f93/u5165/u7528/u6237/u540d
hello.page.hello=/u4f60/u597d
hello.page.wellocome=/u6b22/u8fce/u6765/u5230Javamxj/u7684Blog

# Hello/u5b9e/u4f8b/u4f7f/u7528/u7684/u8d44/u6e90/u6587/u4ef6
 
hello.title=/u7b2c/u4e00/u4e2aStruts/u5e94/u7528
hello.prompt.user=/u8bf7/u8f93/u5165/u7528/u6237/u540d
hello.page.hello=/u4f60/u597d
hello.page.wellocome=/u6b22/u8fce/u6765/u5230Javamxj/u7684Blog

这样的操作对于一个或两个资源文件还行，如果多个资源文件，这样未免有些太麻烦了。你可以建立一个批处理文件（.bat）；或者建立一个Ant文件，利用其包含的native2ascii任务，也可以进行批处理。

方法二：     UTF-8 转换工具，这是一个JS脚本，保存后可以对输入的字符串进行转换，代码如下

<html>
<head>
<title>UTF8 转换工具</title>
<div align=center>
<center>
<table border=0 cellpadding=0 cellspacing=0 style="border-collapse: collapse" width=600 id=AutoNumber1 height=26>
    <tr>
      <td width=100% height=26>
      <p align=center><font face=黑体 size=5 color=#FF0000>UTF-8 转换工具</font></p>
      <p>使用方法：</p>
      <p>　　在下面的文本框中输入中文文字，按“转化”，即可将其转化为UTF-8字符。</p>
      <p>　　再按“还原”，即可将其还原为简体中文。</td>
    </tr>
</table>
</center>
</div>
<p align=center>
<textarea cols=82 rows=10 id=code>
</textarea> </p>
<p align=center>
<input type=button οnclick=encode(code,this) value=转化>
<script>
var mode="zhuan";
function encode(obj,btn){
if(mode=="zhuan"){
obj.value=obj.value.replace(/[^/u0000-/u00FF]/g,function($0){return escape($0).replace(/(%u)(/w{4})/gi,"&#x$2;")});
btn.value="还原";
mode="huan";
}else{
obj.value=unescape(obj.value.replace(/&#x/g,'%u').replace(/;/g,''));
btn.value="转化";
mode="zhuan";
}
}
</script></p>

yuhua3272004

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
汉字问题 UTF-8编码乱码如何实现汉字转化

如何实现汉字转化　如果要支持国际化,那么页面的编码必须为UTF-8,因为客户端的浏览器都支持UTF-8编码。下面做个简单的测试：建立一个html文件，内容很简单，如下 Java代码 "-//W3C//DTD HTML 4.0 Transitional//EN"> New Document "Content-Type" conten
复制链接

扫一扫