Synonyms最好的中文近义词工具包

最新推荐文章于 2022-03-09 16:54:39 发布

pan15125284

最新推荐文章于 2022-03-09 16:54:39 发布

阅读量1k

点赞数

分类专栏：自然语言

本文链接：https://blog.csdn.net/pan15125284/article/details/107226349

版权

自然语言专栏收录该内容

14 篇文章 2 订阅

订阅专栏

1、中文分词

import synonyms
synonyms.seg("中文近义词工具包")

分词结果，由两个list组成的元组，分别是单词和对应的词性。

(['中文', '近义词', '工具包'], ['nz', 'n', 'n'])

2、查找近义词

import synonyms
print("人脸: %s" % (synonyms.nearby("人脸")))
print("识别: %s" % (synonyms.nearby("识别")))
print("NOT_EXIST: %s" % (synonyms.nearby("NOT_EXIST")))

synonyms.nearby(WORD)返回一个元组，元组中包含两项：([nearby_words], [nearby_words_score])，nearby_words是WORD的近义词们，也以list的方式存储，并且按照距离的长度由近及远排列，nearby_words_score是nearby_words中对应位置的词的距离的分数，分数在(0-1)区间内，越接近于1，代表越相近。比如:

synonyms.nearby(人脸) = (
    ["图片", "图像", "通过观察", "数字图像", "几何图形", "脸部", "图象", "放大镜", "面孔", "Mii"], 
    [0.597284, 0.580373, 0.568486, 0.535674, 0.531835, 0.530
095, 0.525344, 0.524009, 0.523101, 0.516046])

3、两个句子的相似度比较

4、获得一个词语的向量，该向量为numpy的array，当该词语是未登录词时，抛出 KeyError异常。