竞赛复盘(1)- CCF BDCI 2019 互联网新闻情感分析

本文回顾了2019年CCF BDCI的互联网新闻情感分析比赛,重点介绍了比赛任务——新闻情感的正面、中性和负面分类。文中分享了获得决赛第一的解决方案,包括特征工程、模型迭代和提升分数的关键技巧,如使用伪标签的融合策略。此外,还提到伪标签的实现方法,通过多个预测结果的投票来提高准确性。
摘要由CSDN通过智能技术生成

背景

比赛官网:互联网新闻情感分析
类型: NLP-情感分析(Sentiment Analysis)
赛题任务:
参赛者需要对我们提供的新闻数据进行情感极性分类,其中正面情绪对应0,中性情绪对应1以及负面情绪对应2。根据我们提供的训练数据,通过您的算法或模型判断出测试集中新闻的情感极性。

解决方案

CCF BDCI 2019 互联网新闻情感分析 复赛top1解决方案

解读

Top1解决方案由cxy229提供,大佬已经为各位小伙伴的复现学习做了详细说明,尤其是方案ppt、复现文档和数据封装,让我们容易理解特征工程、模型迭代和提分过程,非常建议大家去看里面的讲解。

Trick-伪标签

小白的我一直不理解如何有效实现伪标签,以下将用czx_001_投票融合4伪标签.ipynb

论述:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值