Task2 数据读取与数据分析
赛题:零基础入门NLP赛事-新闻文本分类
地址:新闻文本分类
学习目标
- 学习使用pandas读取赛题数据
- 分析赛题数据的分布规律
数据读取
该数据是以csv格式进行存储的,使用pandas完成数据读取操作
read_csv:
- filepath:文件路径
- sep:分隔符,制定没每列的分隔符
- nrows:一次读取多少条文件,由于数据集较大,先设置读取100条数据
赛题:零基础入门NLP赛事-新闻文本分类
地址:新闻文本分类
该数据是以csv格式进行存储的,使用pandas完成数据读取操作
read_csv: