达观杯文本处理(一)
数据获取
数据下载地址:
添加链接描述
下完之后会得到一个压缩包。
处理过程
我的方式简单粗暴,直接读取的:
import pandas as pd
data_path='E:/data/new_data/'
train_data=pd.read_csv(data_path+"train_set.csv")
test_data=pd.read_csv(data_path+"test_set.csv")
train_data.head()
print(train_data['class'].describe())
print(train_data['class'].value_counts())
结果: