1、相对路径载入报错时,尝试使用os.getcwd()查看当前工作目录
import os
os.getcwd()
2、逐块读取
- read_csv()函数有一个chunkSize参数,通过指定一个chunk Size分块大小来读取文件,返回的是一个可迭代的对象Text FileReader
- 为什么要逐块读取?
电脑内存不足,不能一次性的读取时,此时就可以对csv文件进行分块读取。
#写入代码
chunker = pd.read_csv('train.csv', chunksize=1000)
3、将表头改为中文
法一:
df = pd.read_csv('train.csv', names=['乘客ID','是否幸存','仓位等级','姓名','性别','年龄','兄弟姐 妹个数','父母子女个数','船票信息','票价','客舱','登船港口'],index_col='乘客ID',header=0)