Moodlens:一个基于表情符号的中文微博情感分析系统(A3, SIGKDD2012)

Moodlens: an emoticon-based sentiment analysis system for chinese tweets Moodlens:一个基于表情符号的中文微博情感分析系统(A3, SIGKDD2012)

文章建立了一个叫Moodlens的系统,是微博上第一中文微博情感分析系统。在Moodlens中,95个表情符号对应四个情感类:生气,厌恶,喜悦和悲伤,作为微博的类标签。收集了350万标记微博作为语料并且训练了一个快速朴素贝叶斯分类器。还实现了一个增量学习方法来处理情感转移和新词产生问题。通过使用高效朴素贝叶斯分类器,Moodlens能够进行实时在线情感监测
Moodlens系统的主要贡献:帮助解决长期存在的短文本稀疏问题;检测四种类型的情感:生气,厌恶,喜悦和悲伤,而不是传统的二值情感分析;实现了一个增量学习机制;有能力进行实时微博处理和分类,可以作为一个实时异常事件监测系统。

基于表情符号的方法

在1000多个表情符号中,手工选择95个作为情感标签(记为E),划分它们为4个不同的情感类。
从2010年12月到2011年2月,Moodlens收集了7000多万的微博,抽取包含E中表情符号的350万微博作为标记微博集并分类,记为T。这些微博可以作为初始情感语料。对于T中的每条微博,Moodlens转化其为词序列 { ωi} ωi 是一个词,i是它在t中的位置。
在Moodlens中,采用简单的朴素贝叶斯方法建立分类器,需要少量的训练时间并且快速预测类别。从标签微博,获得单词 ωi 属于情感类别 cj 的先验概率 P(ωi|cj)=ncj(ωi)+1q(ncj(ωq)+1) j=1,2,3,4 ncj(ωi) 是词 ωi 在类 cj 中所有微博中出现的次数,使用拉普拉斯平滑来避免0概率问题。
建立NB分类器:对于一个词序列为

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
好的,以下是一个简单的关于谷爱凌的网站设计: HTML部分: ```html <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>谷爱凌 - 人物介绍</title> <link rel="stylesheet" href="style.css"> </head> <body> <header> <h1>谷爱凌</h1> <nav> <ul> <li><a href="#introduction">人物介绍</a></li> <li><a href="#image">人物形象</a></li> <li><a href="#contribution">人物贡献</a></li> </ul> </nav> </header> <main> <section id="introduction"> <h2>人物介绍</h2> <p>谷爱凌(Grace Gu)是一位中国人工智能科学家,目前就职于微软亚洲研究院。</p> <p>谷爱凌于2017年获得了ACM SIGKDD最佳学生论文奖,2018年被MIT科技评论评选为全球35岁以下青年科学家。</p> </section> <section id="image"> <h2>人物形象</h2> <img src="grace-gu.jpg" alt="谷爱凌照片"> </section> <section id="contribution"> <h2>人物贡献</h2> <p>谷爱凌在机器学习、自然语言处理和计算机视觉等领域做出了杰出的贡献。</p> <p>她在自然语言处理领域的工作主要涉及机器翻译和对话系统方面,提出了一些创新性的方法和模型,并在各项国际比赛中取得了优异的成绩。</p> <p>谷爱凌的研究成果对人工智能的发展和应用具有重要意义。</p> </section> </main> <footer> <p>版权所有 © 2021 谷爱凌</p> </footer> </body> </html> ``` CSS部分: ```css /* Reset CSS */ * { margin: 0; padding: 0; box-sizing: border-box; } /* Global Styles */ body { font-family: Arial, sans-serif; font-size: 16px; line-height: 1.5; color: #333; background-color: #f0f0f0; } header { background-color: #fff; padding: 20px; box-shadow: 0 0 10px rgba(0,0,0,.1); position: sticky; top: 0; } h1 { font-size: 32px; font-weight: bold; margin-bottom: 10px; } nav ul { list-style: none; display: flex; } nav li { margin-right: 20px; } nav a { display: block; padding: 10px; color: #333; text-decoration: none; } nav a:hover { background-color: #333; color: #fff; } main { max-width: 800px; margin: 50px auto; padding: 20px; background-color: #fff; box-shadow: 0 0 10px rgba(0,0,0,.1); } section { margin-bottom: 30px; } h2 { font-size: 24px; font-weight: bold; margin-bottom: 10px; } img { max-width: 100%; height: auto; } footer { background-color: #333; color: #fff; padding: 10px; text-align: center; } ``` 这是一个简单的响应式设计,使用了HTML5和CSS3的一些新特性,具有良好的可读性和可维护性。在这个设计中,用到了一些常见的布局方式和样式技巧,如sticky header、flexbox布局、响应式图片等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值