深蓝词库转换2.4版发布,支持最新的搜狗用户词库备份bin格式

很高兴的告诉大家,感谢GitHub上的h4x3rotab提供python版的搜狗用户词库备份bin格式的解析算法,感谢tmxkn1提供了C#版的实现,深蓝词库转换终于迎来了一个重大更新,能够支持搜狗用户词库的bin格式备份的导出了。再也不用受到搜狗输入法的钳制,可以自由切换到其他输入法了。搜狗bin词库只解析到了用户词条和词频,没有拼音,所以如果要导出其他拼音输入法,中间转换工具会根据词条的内容重新生成拼音。

image

另外在2.4版中,增加了用户词频强制设置的功能,比如将搜狗用户词库bin格式备份转换为Win10自带的微软拼音,那么词频会导致该词条在微软拼音上的位置不对,那么我们就需要忽略掉搜狗bin格式解析出来词频,而是使用1表示词频,这样在微软拼音中才会显示正常。

image

设置了强制的默认词频后,所有词频将按照新词频算法生成。

image

导入到Win10自带微软拼音的用户自定义短语后的效果如图:

image

最新版的深蓝词库转换的下载地址:

https://github.com/studyzy/imewlconverter/releases

最后,再声讨一下一个叫“ 奥创词库转换”的,把我的深蓝词库转换代码拿来改一下界面,就变成了自己的软件,极度无耻和恶心。深蓝词库转换一直是免费绿色开源的,但是也看不惯这种无底线的剽窃行为,强烈谴责一下。

输入法词库转换, 基于C#开发,所以电脑上必须安装.Net Framework 2.0才能正常运行,如果双击“深蓝词库转换.exe”后弹出错误窗口,请下载安装.Net Framework 2.0再试。 1.1支持搜狗的细胞词库(scel格式)的转换,您可以到搜狗网站下载细胞词库导入到您其他输入法或者手机输入法中! QQ的分类词库格式还没有研究出来怎么解析。 1.2支持了紫光拼音输入法和拼音加加输入法的词库导入导出功能。增加了批量导入的功能。修复了有些scel格式词库导入时报错。 1.3增强了多音字注音功能和外挂多音字注音词库功能,另外还提供了直接导出而不显示转换结果的选项。 1.3.1增加了对新浪拼音输入法的支持。 1.4增加了对触宝输入法的支持,增加了拖拽功能。 1.5增加了百度分类词库bdict格式转换,增加了命令行调用功能。 1.6修改了搜狗细胞词库解析和QQ手机词库解析的函数,支持最新格式。 1.7增加了梦寐已久的QQ分类词库(qpyd格式)的转换,调整了下拉列表的顺序,增加了拖拽文件时的文件类型自动识别等功能。 1.8增加了自定义编码的输出,增强了命令行功能,请使用-?查看命令行帮助。实现了百度手机分类词库(bcd格式)、小小输入法和微软拼音输入法的词库功能,但是可能由于输入法的原因,会导入失败。 1.9增加了微软英库拼音输入法、FIT输入法、搜狗Bin格式备份词库、中州韵(小狼毫、鼠须管)、各种常用五笔输入法的支持,增加词库文件分割功能。 2.0支持多种编码的Rime输入法,支持多种编码的小小输入法,增加了对灵格斯ld2词典格式支持和英语词库支持,增加了简繁体转换功能,增加了对雅虎奇摩输入法、仓颉平台的支持,增强了对各五笔和郑码输入法的支持,同时优化了内部代码,增强自定义规则的功能。 如果还有更多的词库需要转换,或者对该词库转换工具有什么建议,请联系:studyzy@163.com 博客:http://studyzy.cnblogs.com 新浪微博:http://weibo.com/studyzy 深蓝词库转换的微博:http://weibo.com/imewlconverter
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值