汉字问题 UTF-8编码 乱码如何实现汉字转化

如何实现汉字转化
 
如果要支持国际化,那么页面的编码必须为UTF-8,因为客户端的浏览器都支持UTF-8编码。
下面做个简单的测试:
建立一个html文件,内容很简单,如下
Java代码 复制代码
  1. <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">   
  2. <HTML>   
  3. <HEAD>   
  4. <TITLE> New Document </TITLE>   
  5. <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />   
  6. </HEAD>   
  7. <BODY>   
  8. 这是一个中文字符串<BR>   
  9. 这是一个中文字符串   
  10. </BODY>   
  11. </HTML>  
以上代码保存后,在IE中打开,你可以看到
这是一个中文字符串
Β???
第二行显示的可能不同机器显示不一样,但是应该都是乱码。
下面进行第二步,返回刚才的页面,修改浏览器的编码方式,可以看得到
无论怎么改变编码方式,第一行永远现实的是“这是一个中文字符串”,只有在编码方式为简体中文的时候,第二行才不显示乱码。
所以,如果要你的web站点支持国际化,那么除了编码方式要为UTF-8,而且页面中的中文部分(包括中文的标点符号)都要经过UNICODE编码。
UTF-8编码工具:
方法一:     JDK的native2ascii工具
   
native2ascii-本地码-至-ASCII 码转换器

将含有本地编码字符(既非 Latin1 又非 Unicode 字符)的文件转换为 Unicode 编码字符的文件。

结构
native2ascii [options] [inputfile [outputfile]]

说明
Java 编译器和其它 Java 工具只能处理含有 Latin-1 和/或 Unicode 编码(/udddd 记号)字符的文件。native2ascii 将含有其它字符编码的文件转换成含 Latin-1 和/或 Unicode 编码字符的文件。

若省略 outputfile,则使用标准输出设备输出。此外,如果也省略 inputfile,则使用标准输入设备输入。


选项
-reverse
执行相反的操作:将含 Latin-1 和/或 Unicode 编码字符的文件转换成含本地编码字符的文件:

-encoding encoding_name
指定转换过程使用的编码名称。缺省的编码从系统属性 file.encoding 中得到。encoding_name 字符串必须是符合要求的字符串。


比如可以这样利用native2ascii:
native2ascii -encoding gbk application_zh_CN.properties  temp.properties
  这里将根据application_zh_CN.properties输出了一个临时文件temp.properties,然后把application_zh_CN.properties中的文件内容替换为这个临时文件的内容就可以了。

转换后的application_zh_CN.properties 
Java代码 复制代码
  1. # Hello/u5b9e/u4f8b/u4f7f/u7528/u7684/u8d44/u6e90/u6587/u4ef6   
  2.     
  3. hello.title=/u7b2c/u4e00/u4e2aStruts/u5e94/u7528   
  4. hello.prompt.user=/u8bf7/u8f93/u5165/u7528/u6237/u540d   
  5. hello.page.hello=/u4f60/u597d   
  6. hello.page.wellocome=/u6b22/u8fce/u6765/u5230Javamxj/u7684Blog  


  这样的操作对于一个或两个资源文件还行,如果多个资源文件,这样未免有些太麻烦了。你可以建立一个批处理文件(.bat);或者建立一个Ant文件,利用其包含的native2ascii任务,也可以进行批处理。

方法二:     UTF-8 转换工具,这是一个JS脚本,保存后可以对输入的字符串进行转换,代码如下


<html> 
<head> 
<title>UTF8 转换工具</title> 
<div align=center> 
  <center> 
  <table border=0 cellpadding=0 cellspacing=0 style="border-collapse: collapse" width=600 id=AutoNumber1 height=26> 
    <tr> 
      <td width=100% height=26> 
      <p align=center><font face=黑体 size=5 color=#FF0000>UTF-8 转换工具</font></p> 
      <p>使用方法:</p> 
      <p>  在下面的文本框中输入中文文字,按“转化”,即可将其转化为UTF-8字符。</p> 
      <p>  再按“还原”,即可将其还原为简体中文。</td> 
    </tr> 
  </table> 
  </center> 
</div> 
<p align=center> 
<textarea cols=82 rows=10 id=code> 
</textarea> </p> 
<p align=center> 
<input type=button οnclick=encode(code,this) value=转化> 
<script> 
var mode="zhuan";  
function encode(obj,btn){  
if(mode=="zhuan"){  
  obj.value=obj.value.replace(/[^/u0000-/u00FF]/g,function($0){return escape($0).replace(/(%u)(/w{4})/gi,"&#x$2;")});  
  btn.value="还原";  
  mode="huan";  
}else{  
  obj.value=unescape(obj.value.replace(/&#x/g,'%u').replace(/;/g,''));  
  btn.value="转化";  
  mode="zhuan";  
}  
}  
</script></p> 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值