ToolBox系列工具之Detector 1.用Kindle原版系统的童鞋会知道,国内的txt大部分都是gb2312编码,在Kindle上识别不是太好,一些文本编辑工具,比如Notepad++,也可以转换文本文件格式,但是只能一个一个转换不太方便。有了toolbox_detector,就方便多了,把所有要转换的文件放在一起,一下子全部就转换成需要的格式了,很方便。 2.编译过网上开源代码的童鞋,尤其是编译过UltimateToolbox的童鞋更加清楚,下载下来的源代码,总是因为codepage问题,无法编译,并且源文件动辄就是几十上百个,用Notepad++一个一个转换格式,非疯掉不可。 工具比较粗糙,以实用性为主。语法格式: 比如我的C盘的test文件夹下有一堆需要转换的文件(夹),想转换成utf-8编码的格式,我可以这样用,双击toolbox_detector,输入: 比如我的D盘target文件夹下有个test.txt文件需要转换为shift_jis格式,我可以这样用,双击toolbox_detector,输入: 工具用Python写成,使用了开源框架chardet。目前支持的格式有 Big5, GB2312/GB18030, EUC-TW, HZ-GB-2312, and ISO-2022-CN (Traditional and Simplified Chinese) EUC-JP, SHIFT_JIS, and ISO-2022-JP (Japanese) EUC-KR and ISO-2022-KR (Korean) KOI8-R, MacCyrillic, IBM855, IBM866, ISO-8859-5, and windows-1251 (Russian) ISO-8859-2 and windows-1250 (Hungarian) ISO-8859-5 and windows-1251 (Bulgarian) windows-1252 ISO-8859-7 and windows-1253 (Greek) ISO-8859-8 and windows-1255 (Visual and Logical Hebrew) TIS-620 (Thai) UTF-32 BE, LE, 3412-ordered, or 2143-ordered (with a BOM) UTF-16 BE or LE (with a BOM) UTF-8 (with or without a BOM) ASCII |
ToolBox系列工具之Detector
最新推荐文章于 2023-04-27 21:42:55 发布