html实体编码转换工具,编码字符串转换工具(CodeView)

UTF16,UTF32,UNICODE,ANSI,CP54936编码字符串转换工具.例如:在工具中输入"我是中国人",UTF16,UTF32,UNICODE,ANSI,CP54936各栏中会相应显示对应的编码数据.在一些开发编码相关方面会有用到简单好用.本人就常用,很方便.感谢原作者.

CodeView怎么用?

3a8695ec582cbc36bd2e10e3045553be.png

我在工作中经常需要查看几个字的编码,或者查看几个编码对应的字符,所以写了这个工具。用户可以在文本栏输入文本,或者在编码栏输入对应的编码。在您输入的同时,其它各栏会同步变化。输入编码格式是固定的:必须用两个16进制数字表示一个字节。每个字节用一个空格分隔。

CodeView有一点特色,就是用户可以设置要显示的代码页(两个左边有按钮的编码栏)。点击代码页按钮,在弹出的对话框选择代码页:

c49e0e5674cfbfe1dfc24399435309c0.png

可以用编码栏右侧的保存按钮将数据保存到文件,可以选择是否需要加BOM。BOM的概念可以见 浅谈文字编码和Unicode(下) 的4.2.4节。如果您不熟悉UTF16-LE、UTF16-BE等概念,可以看看这篇文章的的4.2节。

请注意:当某个编码栏不支持特定字符时,CodeView会显示默认编码,通常是3F。

用CodeView解决“字符实体”类型乱码

CodeView 是一个查看文本编码的小工具。我们用它来解决这个乱码问题。

2.1 得到CP1252字符

首先要得到命名实体对应的乱码,即CP1252字符。

à′DÅêÕμ½£¬D»D»

如果你的邮件已经是这个样子,就可以跳过这步。如果你的邮件是

À´ÐÅÊÕµ½£¬Ð»Ð»

你就新建一个文本文件,内容如下:

À´ÐÅÊÕµ½£¬Ð»Ð»

BODY标签之间粘贴上要转换的命名实体。保存到html文件,用浏览器打开,就可以看到:

à′DÅêÕμ½£¬D»D»

复制这些CP1252字符。

2.2 由CP1252字符得到对应编码

打开CodeView。CodeView有两行是可以自己设置编码的。把第二行设置成CP1252,将最后一行设置成CP936,即GBK。 然后把前面复制的字符粘贴到文本行

e0c042c05267bee7b639316d0666a76e.png

这样就可以从CP1252行得到CP1252字符对应的编码文本。在CP1252行点右键,在右键菜单选择“复制全部”复制这行编码文本。

2.3 将编码当作GBK编码转换到文本

先删除掉最后一行的文本,然后将复制的CP1252编码文本粘贴到最后一行,即CP936行。这时在文本行就可以看到对应的文本。

7d6e63f5c3d5a325ee3d5b94d169335a.png

3 结束语

如果把CP1252编码当作GBK编码,文本行还是乱码,你可以再试试Big5,即把最后一行设置成CP950。 这种类型的乱码邮件还是比较容易处理的,你可以自己动手解决它。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值