关于各大输入法词库格式之间的转换

今天想把自己手机里面的词库导入到电脑里面,因为自己手机的输入法是百度输入法,然后电脑配置比较低,就用了QQ输入法纯净版,然后遇到了不同输入法词库格式不是一样的,也就导致了不兼容。在网上找了一圈,发现一款很好用的软件。贴出软件作者的博客:http://www.cnblogs.com/studyzy/archive/2013/01/10/2855403.html。


在手机导出的文本文件,其格式是“ 曾经(ceng|jing) 55000”,而QQ输入法的格式则是“ceng'jing 曾经 55000”,我们会发现,编码和汉字的顺序不同,然后每个编码之间的分隔符也是不同。这是我们就需要使用这款软件进行相应的转换。针对大部分主流的输入法都已经覆盖,所以只需要一键转换就好。如下图


只需要导入你所想要转换的词库文本,然后选择好原文件的输入法选项,选择好目标文件的输入法选项,点击右边的转换按钮便好。

支持转换文件文本另存为等操作。


今天我们要用的工作,常规的转换不能转换,会提示输入格式不对。然后我们对源文件进行相应的处理。

“ 曾经(ceng|jing) 55000”--->>>“ceng'jing 曾经 55000”

从上一行我们可以看到,对比两者的差别,

1、汉字和编码的顺序不对

2、编码括号问题

3、编码每个字的间隔符不同

我们的软件的自定义可以完成哪些工作呢?我们看一下


选择自定义选项


弹出自定义词库编码,选择匹配规则


我们会发现,自定义功能能够帮助我们

1、选择我们的源文件是不是都有编码、词频、拼音编码,如果没有的话,可以勾掉相应项;

2、每个编码之间的分隔符,也可以选择相应的分隔符;

3、编码汉字词频之间的分隔符

4、可以调整词条排序

5、可以选择词库格式;

知道软件自定义可以做的工作后,我们可以发现,我们的源文件有括号无法通过自定义除去。所以我们要通过自己先把括号除去

打开词库---》》》


使用替换功能,查找内容填写“(”,替换为“ ”(空格)


查找内容填写“)”,替换为“”(不填)


变成下图的格式


处理到这里就符合软件转换的需求了

我们把文件导入到软件中,选好自定义格式



点击转换按钮


此时转换就完成了,弹窗提示是否导出词库到本地硬盘,选择是。

此时就完成了文件格式的转换。


再导入到相应的输入法就可以了。

以上。


参考:       作者博客:http://www.cnblogs.com/studyzy/archive/2013/01/10/2855403.html

                   知乎留雁:http://www.zhihu.com/question/23210271

输入法词库转换, 基于C#开发,所以电脑上必须安装.Net Framework 2.0才能正常运行,如果双击“深蓝词库转换.exe”后弹出错误窗口,请下载安装.Net Framework 2.0再试。 1.1版支持搜狗的细胞词库(scel格式)的转换,您可以到搜狗网站下载细胞词库导入到您其他输入法或者手机输入法中! QQ的分类词库格式还没有研究出来怎么解析。 1.2版支持了紫光拼音输入法和拼音加加输入法词库导入导出功能。增加了批量导入的功能。修复了有些scel格式词库导入时报错。 1.3版增强了多音字注音功能和外挂多音字注音词库功能,另外还提供了直接导出而不显示转换结果的选项。 1.3.1版增加了对新浪拼音输入法的支持。 1.4版增加了对触宝输入法的支持,增加了拖拽功能。 1.5版增加了百度分类词库bdict格式转换,增加了命令行调用功能。 1.6版修改了搜狗细胞词库解析和QQ手机词库解析的函数,支持最新格式。 1.7版增加了梦寐已久的QQ分类词库(qpyd格式)的转换,调整了下拉列表的顺序,增加了拖拽文件时的文件类型自动识别等功能。 1.8版增加了自定义编码的输出,增强了命令行功能,请使用-?查看命令行帮助。实现了百度手机分类词库(bcd格式)、小小输入法和微软拼音输入法词库功能,但是可能由于输入法的原因,会导入失败。 1.9版增加了微软英库拼音输入法、FIT输入法、搜狗Bin格式备份词库、中州韵(小狼毫、鼠须管)、各种常用五笔输入法的支持,增加词库文件分割功能。 2.0版支持多种编码的Rime输入法,支持多种编码的小小输入法,增加了对灵格斯ld2词典格式的支持和英语词库支持,增加了简繁体转换功能,增加了对雅虎奇摩输入法、仓颉平台的支持,增强了对各五笔和郑码输入法的支持,同时优化了内部代码,增强自定义规则的功能。 如果还有更多的词库需要转换,或者对该词库转换工具有什么建议,请联系:studyzy@163.com 博客:http://studyzy.cnblogs.com 新浪微博:http://weibo.com/studyzy 深蓝词库转换的微博:http://weibo.com/imewlconverter
### 回答1: 将百度输入法词库转换为txt的方法有很多,以下是其中一种简单的方法: 1. 首先,确保已经安装了百度输入法,并打开软件。 2. 在百度输入法的菜单栏中,选择“工具”选项,然后选择“词库管理”。 3. 在词库管理界面中,选择需要导出的词库,点击“导出”按钮。 4. 弹出的导出窗口中,选择导出格式为“文本文件(TXT)”,点击“确定”按钮。 5. 在保存对话框中,选择保存的路径和文件名,并点击“保存”按钮。 6. 等待一段时间,百度输入法将会将词库转换为txt格式并保存在指定路径中。 7. 打开保存的txt文件,即可查看导出的词库内容。 注意:以上方法适用于百度输入法的较早版本,若是使用最新版本的百度输入法,则可能有所不同。此外,本文只提供了一种常用的转换方法,您也可以在网上搜索其他转换词库的方法。 ### 回答2: 将百度输入法词库转换为txt文件可以通过以下步骤来完成: 首先,找到并打开百度输入法词库的存储位置。通常情况下,词库文件存储在以下路径中:C:\Users\用户名\AppData\Roaming\Baidu\BaiduInput\XXXX(具体路径可能因不同操作系统版本而有所不同)。 接下来,在词库文件夹中找到一个以“皮肤词库”为名的文件夹,并打开它。在这个文件夹中,你应该能够找到以“.db”为后缀的词库文件。这些文件就是你需要转换词库文件。 然后,你可以使用词库转换工具将这些.db文件转换为txt文件。网上有许多免费的词库转换工具可供选择,你可以根据自己的需求选择其中的一款。 打开选定的词库转换工具,然后将.db文件导入到工具中。根据工具的指导,选择输出为txt文件的选项,并指定保存转换后文件的路径。 最后,点击转换按钮并等待转换过程完成。一旦转换完成,你就能在指定的保存路径中找到txt文件。 通过以上步骤,你就能将百度输入法词库成功转换为txt文件,方便后续的使用和处理。如果你需要,还可以进一步编辑这些txt文件以满足个人需求或进行其他操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值