导入包
import pandas as pd
创建.csv文件
id,shuju,label
1,3,one
2,7,two
5,7,three
6,8,four
3,5,five
header属性
#不加上header后第一行会成为表头
a = pd.read_csv("../data/head.csv")
print(a)
#加上header后第一行就不会成为表头了
a = pd.read_csv("../data/head.csv",header=None)
print(a)
names属性
#加上name,会用name中的值代替表头0,1,2.....
a = pd.read_csv("../data/head.csv",header=None,names=['a','b','c'])
print(a)
skiprows属性
#skiprows=2表示跳过前两行,直接从第三行开始读
a = pd.read_csv("../data/head.csv",skiprows=2,header=None,names=['a','b','c'])
print(a)
nrows属性
#nrows=2表示读取前两列
a = pd.read_csv("../data/head.csv",nrows=2,header=None,names=['a','b','c'])
print(a)
#同时加上nrows=2和skiprows=2表示从低三行开始读取前两列
a = pd.read_csv("../data/head.csv",skiprows=2,nrows=2,header=None,names=['a','b','c'])
print(a)
chunksize属性
这个属性返回的就是一个迭代器,用于分批次读取数据
他是每次取文档“内容”(即不包含表头)的数据的前**条