java 文本倾向分析_基于词典的中文情感倾向文本分析工具.pptx

本文介绍了基于词典的中文情感倾向文本分析工具,利用FudanNLP进行分词,结合情感词典和规则处理否定词、程度词,对文本进行句子、段落和篇章级别的分析,最终确定情感倾向。
摘要由CSDN通过智能技术生成

基于词典的中文情感倾向文本分析工具; 情感倾向可认为是主体对某一客体主观存在的内心喜恶,内在评价的一种倾向。

情感倾向方向

情感倾向度;目前,情感倾向分析的方法主要分为两类:

基于情感词典的方法;

是基于机器学习的方法。;文本情感分析的分析粒度: 词语; 句子; 段落; 篇章。;解决较短文本的情感分析,篇章级文本情感分析的基础。;使用工具:语言:java中文分词系统: FudanNLP-1.5情感词典:知网情感词典;1、文本切割转换;将文档D以换行符”/n”分割成段落P;将段落P用中文里常用的句号、分号、问号、感叹号划分句意的符号,切割成不同的句子[“。”,”;”,”?”,”!”] ; 使用FudanNLP中的分词函数,对短句进行分词。;文本切割的目的是将文本变成我们后续分析需要的格式:

“我今天很不高兴。”

[(1,“我” ,“代词”),(2,“今天”,”时态词”),(3,“很”,”副词”),(4,“不”,”否定词”),(5,“高兴”,“形容词”)] ;2、情感定位;否定词的修饰会使情感词语的情感极性发生改变。

多重否定:当否定词出现奇数次时,表示否定意思;当否定词出现偶数次时,表示肯定意思。

否定词典NotDict,并设置其权值为W=-1。

; 当程度副词修饰情感词,该情感词的情感倾向程度发生了变化。;type | 权值超|over 1.5很|very 1.25极其|extreme / 最|most 2较|more 1.2欠|insufficiently 0.5稍| slightly 0.8;①经过文本切割转换[(1,“我” , “代词”), (2,“今天”,“时态词”), (3,“很”, “副词”), (4,“不”, “否定词”), (5,“高兴”,“形容词”)]②情感定位[(5,“积极词”,4), (4, “否定词” ,-1)], (3, “程度词”,1.25)] ; 篇章级情感倾向通过聚合篇章中所有的句子的情感倾向来计算得出。 句子级由句子中所含情感词来计算。;???我很不高兴”——分词之后: 我 很 不 高兴“我不很高兴”——分词之后: 我 不 很 高兴;W = 1;If 位置(否定词)> 位置(程度词):W = -1; 意群情感值 = W * 程度词权重 * 情感词权重;endIf 位置(否定词)< 位置(程度词):W = 0.5; 意群情感值 = W * 程度词权重 * 情感词权重;end 如果句子里出现多个否定词,则处理办法为:For n in 所有否定词:?W = -1 * W;句子情感值 = sum(意群情感值1,意群情感值2……)段落情感值 = average(句子1情感值,句子2情感值……)文档情感值 = average(段落1情感值,段落2情感值……); 最后可以通过整个文章的情感值的正负号以及权值大小来判断情感倾向是积极的还是消极的。;Thank you

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值