淘宝评论关键词提取方案

##相关文章 https://www.zhihu.com/question/20905103

方案 PS:语义分析的概要过程大家可以去程序员杂志七月刊上阅读

作为这个产品技术团队之一,简单说下这个过程: 1,按类目特征,拉取这个类目下的评论,进行分词,统计词频; 2,对词进行聚类,包含常用的LDA,结合本体库,将词进行归类和分类,建立语料库;(分类是最重要的一步,比如服装类目下学院风、淑女、熟女、休闲等都会归为款式这类) 3,属性情感搭配,建立属性词和情感词的连接关系,判断分句的情感; 4,属性词+情感词转换到属性类的情感,对句子进行位置标记; 5,将属性情感和位置标记结果build到搜索中,便于根据标签反向检索内容。

转载于:https://my.oschina.net/u/2307114/blog/833840

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值