关于关键词抽取的一些思考

问1:关键词提取是怎么做的?
答1:1)topic主题词抽取(lda)、词位置信息的关键词抽取(KE)、标题中的词(title)、停用词
2)按照策略选择5个候选关键词:主题词+标题中的词;KE+标题中的词;主题词+KE;主题词
3)topic关键词抽取:分词、特征选择、主题词抽取
4)分词:直接使用微博的分词工具,调用接口
5)特征选择:卡方、互信息、特征停用词过滤


问2:关键词提取怎么用的?
答2:1)文章自动打标签
2)聚合阅读


问3:关键词提取定位
答3:属于非结构化数据进行结构化处理的一部分
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值