Moodlens: an emoticon-based sentiment analysis system for chinese tweets. 2012年北航在Kdd上发表的论文。论文页数不多,Moodlens系统是亮点;提出用贝叶斯方法对微博评论数据进行分类(虽然并不是他提出的);后面又对贝叶斯分类器改进,在系统里实现了能实时微博数据流的增量贝叶斯分类器;通过表情符号将含有表情的微博分成了四类:angry、disguesting、joyful、sad;从70亿条微博数据中提取了符合四类的3.5亿条数据作为训练数据;提出将Moodlens用于用户情感监测,指出在当时属于国内领先。