论文名称:A Bi-directional LSTM Approach for Polyphone Disambiguation in Mandarin Chinese
时间:2016年ISCSLP
单位:西工大,微软
基本思路:依靠sentence中多音字的POS(Part-of-Sentence)和上下文的POS确定多音字的发音。POS标注使用工具NLPIR toolkit标出。
依靠多音字的POS确定多音字的发音的例子:
可以看出通过朝字所在的词的POS既可以区分出读音。
需要依靠上下文的POS确定多音字发音的例子:
转字在两句中具有同样的POS标签,可以通过上下文的POS标签判断出读音。
其中表现最好的模型的网络结构:两层Bi-LSTM,hidden size=512,context = 1 word,即前看一个词后看一个词。
数据集:从网上摘取了174899个句子,自行用拼音标注,选取了79个出现频率高的多音字,共186个发音和null。
输入:带POS标注的多音字(或者多音字在的词),即上下文的POS标注。
输出:多音字的发音。
效果:该基于数据的方法比之前基于规则的方法要好