零基础入门NLP-Task01赛题理解


背景:一个有点C++基础对NLP还没有概念的大二学生

学习目标

  1. 理解赛题背景与赛题数据
  2. 完成赛题报名和数据下载,理解赛题的解题思路

赛题数据

匿名处理???

赛题数据为新闻文本,并按照字符级别进行匿名处理。
匿名处理完的数据是这个样子的

匿名处理的数据我还是第一次接触这个概念,网上搜索了下这个概念,懂了一点点意思(慢慢了解)

评测标准

计算公式本来一点都看不懂的,但是看了大佬的理解NLP训练1-赛题理解与评价标准有了一点点的认识

Precision,就是要精准,不愿意做错;Recall的意思是 想到、记得 ,就是要记得所有的细节,就算是错了也没关系,只要覆盖了更多的正确的细节,那“记忆率”就越高,这就是召回率——Reall。
F1-Socre从数学上,它被定义为精确率和召回率的调和平均数。从公式中我们可以看到,F1的大小,同时受 ​Precision和 ​Recall的影响,即 短板效应 ,所以 ​F1 Score比直接平均的结果考虑更平衡,更能说明一个模型的好坏。

解题思路

目前脑子里还没有什么解题的思路,看github 的四种解题思路都还没有那个概念。所以目前的计划就是往下看,把pandas的环境先配置好。
以后慢慢填坑

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值