NLP学习1-赛题理解及评价指标
一,学习目标
1.理解赛题背景应用
2.理解赛题评价指标
3.报名并下载数据
二,比赛报名
地址:天池NLP-新闻文本分类
三,赛题理解
通过竞赛,入门NLP自然语言处理,了解NLP的预处理,模型构建和模型训练等技巧。对新闻文本进行分类
四,数据结构
1.赛题数据为新闻文本,划分出14个分类类别
财经,彩票,房产,股票,家居,教育,科技,社会,时尚,时政,体育,星座,游戏,娱乐。
2.数据结构
训练集20W条样本,测试集A包括5w条样本,测试集B包括5w条样本。
3.标签对应关系
科技:0,股票:1,体育:2,娱乐:3,时政;4,社会:5,教育:6,财经;7,家居:8,游戏:9,房产:10,时尚:11,彩票:12,星座;13
五,评价指标
评价标准为f1评价