Opinion mining and sentiment analysis笔记评论搜索需要解决下列问题
information-gathering行为一个重要的一部分就是发现别人是怎么想的
这个调查覆盖率技术和方法观点导向的寻找信息的系统
1 用户是否在寻找一个主观材料
2 哪些包含了评论性的材料
3 区分整体的情感和特殊的观点
4 表示情感信息
1 整合可能在不同范围内注册的投票
2 选择性标注一些观点
3 不同意和同意观点的代表性观点
4 观点持有者集体的特点
5 考虑观点持有者权威的差异性
1.3
3.1 与标准的基本事实的文本分析的对比
3.2 使opinion mining困难的因素
情感分析的意义
Movie: is this review positive or negative?
• Products: what do people think about the new iPhone?
• Public sentiment: how is consumer confidence? Is despair increasing?
• Politics: what do people think about this candidate or issue?
• Prediction: predict election outcomes or market trends from sentiment
在传统的文本分析里,提到最多的词汇很大概率是关于此的。
Modeling sequential information and discourse structure seems more crucial in sentimental analysis.
4 分类和抽取
4.1问题公式和关键概念
4.1.1 情感两极化以及正向程度
4.1.2 主观性检测以及观点区分
4.1.3 话题-情感分析
4.1.4 观点及视角
4.1.5 文本中的其他非事实信息
4.2特征
4.2.1 术语出现vs.频率
4.2.2 基于术语的特征超过一元语言模型
4.2.3 演讲的一部分
4.2.4 语法
4.2.5 否定
4.2.6 话题导向的特征
4.3 标签数据的影响
4.4 语境适应以及话题-情感交互
4.4.1 语境考虑
4.4.2 话题考虑
4.5 非监督方法
4.5.1 非监督词典
4.5.2 其他非监督方法
4.6 基于关系信息的分类
4.6.1 句子间的关系以及文档间的关系
4.6.2 谈话参与者的关系
4.6.3 产品特征间的关系
4.7 合作谈话结构
4.8语言模型
4.9对抽取的特殊考虑
4.9.1 区分产品特征以及评论中的观点
4.9.2 涉及观点持有者的问题
5 摘要
5.1 单文本以观点为导向的摘要
5.2 多文本以观点为导向的摘要
5.2.1 一些问题考虑
5.2.2 文本摘要
5.2.2.1 基于话题技术中存在的杠杆作用
5.2.2.2 不基于话题的摘要技术的文本摘要
5.2.3 非文本摘要
.5.2.3.1有界限的摘要统计:平均相关频率
5.2.3.2 无界限的摘要统计
5.2.3.3 暂时变异和情感时间线
5.2.4 评论质量
5.2.4.1 自动决定评论质量的方法
5.2.4.2 评论者特点考虑
6 更广的推断
6.1 评论的经济影响
6.1.1 调查摘要相关经济文学
6.1.2 应用自动文本分析的经济影响研究
6.1.3 与Word of Mouth的互动
6.2 操作的推断
7公共可用资源
7.1 数据集
7.1.1 获得数据的标签
7.1.2带注释的数据列表
7.2 评价竞选
7.2.1 TREC观点相关的竞争
7.2.2 NTCIR观点相关的竞争
7.3 词典资源
7.4 导论,参考书目和其他引用
8 结语
1. 无交互文本情感分析的普遍技术实现方式
情感分析(sentiment analysis)又称倾向性分析,意见抽取(Opinion extraction),情感挖掘(Sentiment mining),主观分析(Subjectivity analysis)等,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。
目前,情感分析在传统机器学习上的主要研究方法还是基于一些传统算法,例如,SVM、信息熵、CRF等。基于机器学习的情感分析,其优势在于具有对多种特征建模的能力。要用人工标注的单个词作为特征,而语料的不足往往就是性能的瓶颈。
当然也有基于情感词典的情感分析方法,也就是应用情感词典中记录的词语或短语的情感倾向程度和强度信息对文本进行情感分类。这个就比较依赖于人工构建和抽取的特征了。会受到情感词典本身的质量以及适用领域的局限,否定词也是一个小坑。(构建情感词典一般采用bootstrapping的方法)
至于深度学习在情感分析上的种类就比较多了,有各种方法的综合创新,比如有利用LSTM结合句法分析树,还有基于卷积神经网络和支持向量机的。除了准确率能有明显的提高外,重要的是可以自动从无标注的文本中学习文本中的隐藏特征,并可以实现端到端的分类。