参考资料:
http://xueshu.baidu.com/s?wd=paperuri%3A%28b6abec56d591d7b37cdc13716932d1ba%29&filter=sc_long_sign&tn=SE_xueshusource_2kduw22v&sc_vurl=http%3A%2F%2Fwenku.baidu.com%2Fview%2F124e7e2b2af90242a895e542.html&ie=utf-8
基于情感的文本分类
http://xueshu.baidu.com/s?wd=paperuri%3A%28b6abec56d591d7b37cdc13716932d1ba%29&filter=sc_long_sign&tn=SE_xueshusource_2kduw22v&sc_vurl=http%3A%2F%2Fwenku.baidu.com%2Fview%2F124e7e2b2af90242a895e542.html&ie=utf-8
基于情感的文本分类
研究的实际应用:
推荐系统,过滤系统
与基于主题的文本分类类似,不同之处在于具有主观性的词语更重要
算法:
朴素备叶斯:
利用类别的先验概率和特征分布相对于类别的条件概率来计算未知文档属于某一类别的概率。
采用文本向量空间模型表示文档。
最大熵:(待补充)
是在满足系统当前提供的所有条件下寻求分布最均匀的模型, 即熵最大的模型。
分析:
文档的情感主要是通过具有情感倾向的词语( 或共现/ 关联词语) 来体现出来的,
注意:否定词不再作为停用词删除,因为当其否定的对象具有语义倾向的时候,发生反向变化这样的词语主要是有形容词、
名词、动词、成语和习惯用语。
有效识别不带感情倾向的客观语句。
中文分词方法:
备忘:中文情感词典,sentiment analysis,