基于词典的中文情感倾向文本分析工具; 情感倾向可认为是主体对某一客体主观存在的内心喜恶,内在评价的一种倾向。
情感倾向方向
情感倾向度;目前,情感倾向分析的方法主要分为两类:
基于情感词典的方法;
是基于机器学习的方法。;文本情感分析的分析粒度: 词语; 句子; 段落; 篇章。;解决较短文本的情感分析,篇章级文本情感分析的基础。;使用工具:语言:java中文分词系统: FudanNLP-1.5情感词典:知网情感词典;1、文本切割转换;将文档D以换行符”/n”分割成段落P;将段落P用中文里常用的句号、分号、问号、感叹号划分句意的符号,切割成不同的句子[“。”,”;”,”?”,”!”] ; 使用FudanNLP中的分词函数,对短句进行分词。;文本切割的目的是将文本变成我们后续分析需要的格式:
“我今天很不高兴。”
[(1,“我” ,“代词”),(2,“今天”,”时态词”),(3,“很”,”副词”),(4,“不”,”否定词”),(5,“高兴”,“形容词”)] ;2、情感定位;否定词的修饰会使情感词语的情感极性发生改变。
多重否定:当否定词出现奇数次时,表示否定意思;当否定词出现偶数次时,表示肯定意思。
否定词典NotDict,并设置其权值为W=-1。
; 当程度副词修饰情感词,该情感词的情感倾向程度发生了变化。;type | 权值超|over 1.5很|very 1.25极其|extre