《Entity-Level Sentiment Analysis of Issue Comments》论文阅读笔记

文章名:《Entity-Level Sentiment Analysis of Issue Comments

作者 Jin Ding, Hailong Sun, Xu Wang, Xudong Liu

年份 2018

1 Introduction

本文针对开发网站中的开发者问题解决评论进行情感分析。对于开源网站Github的评论进行分析情感。

2 System Design

作者开发了实体情感分析工具Senti SW。结构图如下:Github上面的评论注释作为该工具的输入,过程中所识别的实体为“人”和“物”。如果识别是客观性的,结果输出为"neutral sentiment",如果是主观性,输出结果为<sentiment,entity>元组。该模型主要包含四个模块:数据预处理,特征向量化,情感分类和实体识别。 预处理模块的目的是去除无用的特征,通过去除单词、替换单词和阻止技术来降低噪声。矢量化模块试图通过TF-IDF和Doc2vec将一批单词转换成向量表达。情感分类模块把评论的情感极性转换成三种输出结果:positive,negative,neutral。实体识别模块将从情感分类模块分析出的带有主观情感输出结果(positive和negative)语句进行实体识别为“Person”或“Project”。

2.1 Dataset Generation

Github是一个开源网站,程序员可以上传自己的仓库,其他人可以进行借鉴使用。因此本文通过GitHubAPI从GitHub问题跟踪器构建了一个问题注释数据集,选取了十个深受欢迎的仓库获取评论数据进行分析。 选取的仓库原则如下:(1)至少被标注了5000+stars,表明足够受欢迎。(2)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值