数据集下载 https://www.kaggle.com/c/titanic/overview
使用相对路径:
使用绝对路径:
read_csv和read_table都是是加载带分隔符的数据,每一个分隔符作为一个数据的标志,但二者读出来的数据格式还是不一样的,read_table是以制表符 \t 作为数据的标志,也就是以行为单位进行存储。
#写入代码
df=pd.read_csv('train.csv',names=['乘客ID','是否幸存','仓位等级','姓名','性别','年龄','堂兄弟/妹个数','父母小孩个数','船票信息','票价','客舱','登船港口'],index_col='乘客ID',header=0)
df.head()
#header 指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0
df=pd.read_csv('train.csv',names=['乘客ID','是否幸存','仓位等级','姓名','性别','年龄','堂兄弟/妹个数','父母小孩个数','船票信息','票价','客舱','登船港口'])
df.head()
#不加header的时候英文和中文同时存在
df=pd.read_csv('train.csv')
df.columns=['乘客ID','是否幸存','仓位等级','姓名','性别','年龄','堂兄弟/妹个数','父母小孩个数','船票信息','票价','客舱','登船港口']
df.head()