Expert Systems With Applications 42 (2015) 8745–8752
《Hierarchical emotion classification and emotion component analysis on chinese micro-blog posts》
(下周学术报告,该小敏同学讲这篇文章,先看看。后续可能在补充。--------------机器学习课,要求写一篇和自己方向有关的综述,所以现在要多看论文,多总结才好。)
《基于中文微博帖子的情感层次分类和情感成分分析》
摘要:现有的分类都很粗糙,如果数据集过大,则分类器在分类的时候就会很困难。本文应用数据预处理、特征提取、特征选取,把中文微博帖子进行很细粒度的分类。利用情感层次分类来提高分类器的性能。另外,基于回归值分类过程,我们提出了一个算法来挖掘主要的情感,并计算他们的比率。
主要内容:
1.情感分类
1)四层的层次结构
2)预处理过程:①人名,@+人名;②话题,#话题#;ƒ链接;④位置信息,i am here
3)特征提取:① 表情符号;②POS词性分析
4)特征选取:χ 2 -test;PMI点互信息
5)分类:在支持向量机中采用 SVR package,两个参数 模型参数v和分类阈值。
2.情感成分分析:ECA算法
实验部分:
改进:
1.更新词典,使词典包含更多的情感词和微博中的俚语。
2.在算法中增加更多的特征来使结果达到更高的准确率。
3.3.作为微博中的一些具有讽刺意味的表达的帖子,需要更深的语义分析,情景分析和上下文分析。
注:
1.Meanwhile, SVM can apply to other fields, such as it can be trained with some features so as to identify a test image (Xia, Wang, Sun, & Wang, 2014) and so on.(Page 2)
2., Naive Bayesian, SVM, and SMO