Kaggle最新赛事！附baseline详解！

Amusi（CVer）

于 2024-04-28 13:05:50 发布

阅读量494

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=MzUxNjcxMjQxNg==&mid=2247597774&idx=1&sn=ad5ce5e85b39f19001b13dc506701dce&chksm=f85a85f68e9c9c6908dbdee422daf5a834018461c4703aba91c9ce05d92885a04e1694cc347d&scene=126&sessionid=0

版权

本文介绍了Kaggle最新自动论文评分竞赛，涉及NLP任务，目标是训练模型评估学生论文。通过使用BERT等预训练模型，适合NLP从业者参与。文章还提及了威廉老师的讲座和500+金牌方案的福利，以及数据集和抽奖活动的详情。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天解析一下Kaggle最新比赛：自动论文评分竞赛2.0——Learning Agency Lab - Automated Essay Scoring 2.0。文末有图书抽奖活动！

本次比赛类型是自然语言处理NLP。目标是训练一个模型来为学生论文评分。

本次比赛能帮助大家熟练使用bert等预训练语言模型。比赛4月初刚开始，难度适中，适合所有从事NLP相关工作的同学参加。

有关本次比赛的baseline详解，我邀请了美国TOP20毕业的William老师开了一场讲座。William老师经验丰富，曾带领20+学员斩获Kaggle金牌。

baseline讲座为福利性质，只需0.01元。并赠送500+Kaggle金牌方案！扫码即可领取！

扫码看讲座、领资料、包邮抽图书(文末详情）

赛题讲座

数据集介绍

竞赛数据集包含约24000篇学生撰写的议论性文章。

train.csv - 作为训练数据使用的文章和得分。

essay_id - 文章的唯一ID
full_text - 完整的文章内容
score - 文章的整体得分，范围为1到6

test.csv - 作为测试数据使用的文章。包含与train.csv相同的字段，除了排除了score。

sample_submission.csv - 符合正确格式的提交文件。
essay_id - 文章的唯一ID
score - 文章的预测整体得分，范围为1到6

数据样例：

label分布：

扫码看讲座、领资料、包邮抽图书(文末详情）

500+Kaggle金牌方案

我整理了2023年10场比赛54个金牌方案，CV与NLP方向都有。此外，还有过去几年470场金牌方案。今天分享给大家下载。

扫码看讲座、领资料、包邮抽图书(文末详情）

包邮赠书福利

扫描下方二维码，凭当前文章截图参与抽奖。抽取10名同学，包邮送出《机器学习算法竞赛实战》！图书将在月末统一寄出，感谢同学们的耐心等待。

扫码看讲座、领资料、包邮抽图书

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。