s1.1 载入数据
1 相对路径
# 相对路径:相对路径就是以当前文件为基准进行一级级目录指向被引用的资源文件
df = pd.read_csv('train.csv')
df.head(3)
2 绝对路径
# 绝对路径:绝对路径就是文件的真正存在的路径,是指从硬盘的根目录(盘符)开始,进行一级级目录指向文件
df = pd.read_csv('/Users/apple/Desktop/hands-on-data-analysis-master/第一单元项目集合/train.csv')
df.head(3)
3 逐块读取
# 逐块读取:每1000行为一个数据模块
chunker = pd.read_csv('/Users/apple/Desktop/hands-on-data-analysis-master/第一单元项目集合/train.csv', chunksize=1000)
4 表头改成中文
df = pd.read_csv('/Users/apple/Desktop/hands-on-data-analysis-master/第一单元项目集合/train.csv', names=['乘客ID','是否幸存','仓位等级','姓名','性别','年龄','兄弟姐妹个数','父母子女个数','船票信息','票价','客舱','登船港口'],index_col=