Comments-Attached Chinese Microblog Sentiment Classification Based on Machine Learning Technology
Bo Yan, Bin Zhang, Hongyi Su, and Hong Zheng Key Lab of Intelligent Information Technology, Beijing Institute of Technology, Beijing, CN {yanbo,binz,henrysu,hongzheng}@bit.edu.cn
摘要:当今,随着社交网络的迅速发展,以社群为导向的网络情感分析技术在数据挖掘领域成为热门话题。由于其简洁和灵活的特点,微博对情感分析提出了新的挑战。本文根据朴素贝叶斯(NB)和支持向量机(SVM)提出了一个方法,将微博情感分为积极的和消极的。基于数据处理、情感词典构建,结合用户评论的要素,假定附带评论的微博情感分类有助于提高分类的准确性。本实验证明了该方法的有效性和语言表达方式对消极行为的促进作用。
算法
输入:当前批次下带标签的训练集Tn;当前批次下无标签的测试集Un;当前批次下目标微博微博的评论集Cn;
输出:语义指向,O (Un);
要求:分类所用的分类器