最近阅读了一篇关于观点挖掘的KDD论文(Mining and Summarizing Customer Reviews,KDD04),其挖掘算法很经典,特此做记录。
该论文要解决的问题是,识别用户评论的情感(positive or negative),并作归纳,为用户购买产品提供真实有效的参考。归纳的形式如下(以数码相机为例):
数码相机:
特征: 照片质量
Positive: 253
<用户评论的句子>
Negative: 8
<用户评论的句子>
特征: 大小
Positive: 135
<用户评论的句子>
Negative: 12
……
算法过程