nlp
Campbell001
这个作者很懒,什么都没留下…
展开
-
DataWhale 零基础入门NLP赛事-新闻文本分类 TASK2 数据读取与数据分析
Task2 数据读取与数据分析 赛题:零基础入门NLP赛事-新闻文本分类 地址:新闻文本分类 学习目标 学习使用pandas读取赛题数据 分析赛题数据的分布规律 数据读取 该数据是以csv格式进行存储的,使用pandas完成数据读取操作 read_csv: filepath:文件路径 sep:分隔符,制定没每列的分隔符 nrows:一次读取多少条文件,由于数据集较大,先设置读取100条数据 ...原创 2020-07-22 23:34:43 · 173 阅读 · 0 评论 -
DataWhale 零基础入门NLP赛事-新闻文本分类 TASK1 赛题理解
TASK 1 赛题理解 赛题;零基础入门NLP赛事-新闻文本分类 地址:新闻文本分类 学习目标 理解赛题背景与赛题数据 完成赛题报名和数据下载,理解赛题的解题思路 了解赛题 赛题概况 数据概况 预测指标 分析赛题 赛题概况 赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。 赛题数据由以下几个部分构成:训练集20w条样本,测试集A包括5w条样本,测试集B包括5w条样本。为了预防选原创 2020-07-21 22:59:11 · 169 阅读 · 0 评论