情感倾向性分析训练—在舆情系统中的应用

晴空猎鹰舆情监测系统采用优化后的BERT模型,实现情感分析F1值超过0.85,相较于传统BERT提升5%。该系统通过情感词库搭建、文本情感分析和模型建立,对新闻评论进行情感倾向性分类,如正面、负面和中性,展示了在社会舆论分析中的高效性能。
摘要由CSDN通过智能技术生成

晴空猎鹰舆情监测系统利用基于自研优化后的bert预训练模型,在新闻及社会舆论评价情感分析任务上取得出彩的结果,情感识别指标达到f1>0.85,相对于传统bert,情感识别提升5个点以上。这里以8月11日社会舆论类新闻的网友评论做为示例,具体流程如下。

1. 情感分析-词库搭建
通过对大量中文文本及人物会话分析,发现文本情感的判定基本上通过对通篇的情感词、程度副词及否定词的统计分布来判别,因此,我们搭建了基于情感分析的情感词库以及其它辅助词表。如下图所示。

图1 词典集结构关系图

图1 词典集结构关系图

其中,正/负面情感词通过预先标注的新闻数据中通过统计获得,再人工过滤;程度副词权重(0.52)则通过多人打分,取平均的方式来预定义(0.52), 否定词权重统一定为-1.0;

2. 文本情感分析实现
情感倾向性将文本分为正面、负面、中性三种情感属性,通常由正、负面,以及强弱程度来衡量。本文通过中文分词处理,基于情感词典构建情感表,为每一个分词打分,从而判断判别情感倾向,文本情感分析的流程如下图所示。

文本情感分析的流程图图2 文本情感分析的流程图

3. 建立情感倾向性分析模型

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值