现状:可以用WORD中的拼音指南解决,但是拼音指南一次性只能标注30个字。
思路:找到汉字库,自己做一个工具
需要数据
1、汉字库
2、汉字拼音对应库
3、多音字库,由于多音字没有规律,但是一般有优先次序,比如都字常规念dou,在都市中念du,大都会,念du;
存在困难
多音字组词库网上找不到,初步搜了一下,高质量的要收费,比如海天瑞生。
一般的免费,但是数据不全。
解决途径
1、初步建立多音字库。
2、通过大量文本,识别多音词库,人工建立
猜测一下语音转汉字怎么转的:建立词语库,通过词语库来解决发音问题;
难和易的转换,汉字和英语的几个回合
回合 | 对比 | 英语 | 汉语 |
第1回合 | 书写 | 容易 | 难 |
第2回合 | 单词数量 | 多 | 少 |
第3回合 | 单词增加 | 多 | 极少 |
第4回合 | 学习难度 | 容易 | 难 |
第5回合 | 文字库大小 | 大 | 小 |
第6回合 | 语音库大小 | 大 | 小 |
第7回合 | 组词库 | 小 | 大 |
第8回合 | 语音识别 | 简单 | 复杂 |
以前的语音库来说,中文相对是简单的,倒过来就难很多了。
到了人工智能时代,语音识别中文太难了,主要是没有公开的词库。