- 博客(1)
- 收藏
- 关注
转载 新词发现-基于凝固度和自由度
用python实现新词发现程序——基于凝固度和自由度 互联网时代,信息产生的数量和传递的速度非常快,语言文字也不断变化更新,新词层出不穷。一个好的新词发现程序对做NLP(自然预言处理)来说是非常重要的。 N-Gram加词频 最原始的新词算法莫过于n-gram加词频了。简单来说就是,从大量语料中抽取连续的字的组合片段,这些字组合片段最多包含n个字,同时统计每个字组合的频率,按照词频并设置一个阈...
2020-04-18 17:58:06 1459
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人