ToolBox系列工具之Detector

79 篇文章 0 订阅
ToolBox系列工具之Detector
1.用Kindle原版系统的童鞋会知道,国内的txt大部分都是gb2312编码,在Kindle上识别不是太好,一些文本编辑工具,比如Notepad++,也可以转换文本文件格式,但是只能一个一个转换不太方便。有了toolbox_detector,就方便多了,把所有要转换的文件放在一起,一下子全部就转换成需要的格式了,很方便。
2.编译过网上开源代码的童鞋,尤其是编译过UltimateToolbox的童鞋更加清楚,下载下来的源代码,总是因为codepage问题,无法编译,并且源文件动辄就是几十上百个,用Notepad++一个一个转换格式,非疯掉不可。

工具比较粗糙,以实用性为主。语法格式
  1. path -e target_encoding
复制代码
比如我的C盘的test文件夹下有一堆需要转换的文件(夹),想转换成utf-8编码的格式,我可以这样用,双击toolbox_detector,输入:
c:\test -e utf-8

比如我的D盘target文件夹下有个test.txt文件需要转换为shift_jis格式,我可以这样用,双击toolbox_detector,输入:
d:\target\test.txt -e shift_jis


工具用Python写成,使用了开源框架chardet。目前支持的格式有

Big5, GB2312/GB18030, EUC-TW, HZ-GB-2312, and ISO-2022-CN (Traditional and Simplified Chinese)
EUC-JP, SHIFT_JIS, and ISO-2022-JP (Japanese)
EUC-KR and ISO-2022-KR (Korean)
KOI8-R, MacCyrillic, IBM855, IBM866, ISO-8859-5, and windows-1251 (Russian)
ISO-8859-2 and windows-1250 (Hungarian)
ISO-8859-5 and windows-1251 (Bulgarian)
windows-1252
ISO-8859-7 and windows-1253 (Greek)
ISO-8859-8 and windows-1255 (Visual and Logical Hebrew)
TIS-620 (Thai)
UTF-32 BE, LE, 3412-ordered, or 2143-ordered (with a BOM)
UTF-16 BE or LE (with a BOM)
UTF-8 (with or without a BOM)
ASCII

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值