WordMultiSenseDisambiguation
WordMultiSenseDisambiguation, chinese multi-wordsense disambiguation based on online bake knowledge base and semantic embedding similarity compute,基于百科知识库的中文词语多义项获取与特定句子词语语义消歧.
项目地址:https://github.com/liuhuanyong/WordMultiSenseDisambiguation
项目介绍
一词多义是中文信息处理中一个特别常见的现象,经典的"苹果是水果还是公司"问题一直是困扰大家的一个实际问题,本项目将对这一问题进行尝试,提出相应的技术路线,并结合在线百度百科获取义项,经过义项聚类,义项语义表示,语义相似度计算等方式,对特定语句中的词语语义判定进行尝试.
项目思路
以下是本项目的技术路线图,本项目需要加载预训练词向量,文件太大,没有给出,各位可自行添加.
项目效果
python wordsense_detect.py,运行中文词语语义消歧脚本.
1, 指定需要进行词义消歧的词语word
2, 指定需要极刑词义消歧词语所在的句子
例子:
enter an sent to search:苹果发布新产品了
enter an word to ident