- 博客(1)
- 收藏
- 关注
原创 相似词的挖掘
背景 最近在公司实习,工作需求,需要挖掘一批类似“文化“、“土特产“这种词,这种词的特点之一是直接放在地域词后面,如北京朝阳区文化等,我们已有的语料包含很多query,每个query都是以地域词开头,后面跟着几个term,例如“北京教育怎么样“。 思路 首先我们先用分词工具把这些query分词,然后找到地域词+文化/土特产+X中的X,然后将X去重后排序,得到一系列的文化或者土特产的后缀词,然后
2016-11-13 20:51:45 1323
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人