智能编码集转换器-批量转换UTF-8等字符集/转换换行符

要点:

1. 选定了Notepad3使用的魔改版uchardet,精度比原版uchardet更高!

2. 该 App作者增加软件界面,方便批量转换和有关设置。

win os 绿色软件。 x64

-----------------------------------------------------------------

关联:

1. uchardet

debian 仓库:https://gitlab.freedesktop.org/uchardet/uchardet

  https://www.freedesktop.org/wiki/Software/uchardet/

参考:CharsetDetector / UTF-unknown

  https://github.com/CharsetDetector/UTF-unknown

这个工具下载:https://download.csdn.net/download/ken2232/88435213

-----------------------------------------------------------------

Installation

Debian/Ubuntu/Mint

apt-get install uchardet libuchardet-dev

=====================================

特别优点

字符集探测是著名的老大难问题,就是说,怎样在不知道字符编码的情况下,探测出文本是什么编码,什么字符集。这个问题很难。

所以,你看到的绝大多数转字符集的程序,都是GBK->UTF-8,GBK->BIG5,这种,必须要你提前知道你的文本是什么编码,否则就会乱码。而且,转过一次的文本,再转一次,也会乱码。

我在对比了诸多字符集探测库之后,选定了Notepad3使用的魔改版uchardet,这个魔改版uchardet经过Notepad3作者精心调教,精度比原版uchardet更高!

虽然不能说做到百分百地把字符集探测正确,但正确率也是非常高的!具体多高你试试就知道了。

也正因为解决了字符集探测这个最大的问题,所以上面提到的这些“传统转码程序”的问题,在本程序中通通都不存在!不用管你原来是什么字符集,你只说你要什么就行啦!

智能编码集转换器

本程序用于自动识别文件夹下所有文本文件,自动识别原编码(不必担心反复转码出错了),批量转换到UTF-8等字符集。

功能:

  • 批量转UTF-8/UTF-8-sig/GB18030等
  • 批量转CRLF/LF/CR换行符

运行要求:

  • Win10 x64
  • Win7 x64(理论上可以,没尝试)

Reference

ICU

WTL

uchardet

本程序已开源:https://github.com/tomwillow/SmartCharsetConverter

下载地址:https://github.com/tomwillow/SmartCharsetConverter/releases

下载地址2:链接:https://pan.baidu.com/s/1RF8rM__QH6ceCjYP1UeaPQ?pwd=rvv5

提取码:rvv5

转载:https://zhuanlan.zhihu.com/p/585163944

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
编码批量转换工具 已经用过,绝对好用 【基本介绍】 "批量字符编码转换工具"是绿色软件,单文件免安装,请放心试用。 批量字符编码转换工具可以在gbk,gb23123,unicode,utf8,ansi之间进行汉字编码转换。 【软件特点】 1 支持格式众多的字符串编码转换器 支持几十种字符编码转换。比如utf8gbk,gb2312utf8,ansiutf8,utf8 unicode 转换,utf8转换gb2312,utf16、utf32、utf8编码转换,gbk转换utf8utf8 ascii转换。 2 强大正则表达式支持字符编码转换软件 是唯一同时支持用正则表达式匹配和排除要转换文件夹的批量编码转换工具批量字符编码转换工具文件编码转换的最佳工具。是您必备的unicode编码转换器,它帮助您快速完成编码批量转换utf8 gb2312编码转换举例,编码转换软件工作原理 比如要把D:\web目录下的php文件和html文件utf8gb2312编码, 转换时排除test开头的文件 1 选择文本编码转换的源目录 比如选择D:\web 2 选择文件编码转换的目标目录 比如选择D:\webnew (为防操作失误,目标目录不能和源目录相同) 3 源文件编码选择65001 utf-8 4 目标文件编码选择936 gb2312 5 点选"要转换文件",输入正则表达式: \\.php|\\.html 6 点选"要排除的文件",输入正则表达式: \\test 点击"开始转换"字符编码转换工具就开始转换了,转换成功与否都会在"批量字符编码转换工具"的界面给出提示。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值