NLP情感分析简介:
NLP(Natural Language Processing,自然语言处理)研究用计算机来处理、理解以及运用人类语言(如中文、英文等),达到人与计算机之间进行有效通讯。
自然语言生成三阶段:文本规划、语句规划、实现
NLP应用领域:机器翻译、情感分析、智能问答、文摘生成、文本分类、舆论分析、知识图谱。
情感分析是自然语言处理(NLP)领域的一类任务,又称倾向性分析,意见抽取,意见挖掘,情感挖掘,主观分析等,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。
常用方法:
1、词袋/词典模型
由于机器对于人类语言理解力不强,从而导致文本分析的准确性不高,因此常常需要人工构建词袋/词典的方式,辅助计算机理解,具体做法是构建积极的词语词典和消极的词语词典,对文本进行词频统计,判断积极词汇与消极词汇所占的比重,从而判断文本情感。
但是词袋/词典模型具有没有考虑语句的先后顺序,以及上下文关系的缺点,从2001年的嵌入式词向量表示到2013年的word2vec ,研究已经逐步解决传统词袋表征方式的无序性,并进一步丰富了表征向量的表达能力。
这种方法关键在于构建与维护词典,词典的科学性,准确性。
2、 机器学习模型
由于机器学习的快速发展,循环神经网络(RNN)、Bert模型快速兴起,被广泛地运用于文本分析中。