赛题:零基础入门入门NLP赛事-新闻文本分类
比赛地址:https://tianchi.aliyun.com/competition/entrance/531810/introduction*
1.1数据读取与数据分析
本节内容主要介绍数据的读取与分析,使用pandas
库进行数据的读取操作。
1.1.1 学习目标
1.学习使用pandas
读取赛题数据
2.分析赛题数据的分布规律
1.1.2 数据读取
直接使用pandas
进行数据读取操作
import pandas as pd
train_df = pd.read_csv('train_set.csv', sep='\t')
这里```read_csv··由两部分组成:
1.读取路径,可以为相对路径也可以为绝对路径,这里用的相对路径
2.分隔符sep
, 为每列分割的字符,设置为\t
;
使用head()
查看