一、瞎讲
- pandas读取文件read_csv无法编译含中文的路径
- jupyter编译不能含空格?
- pandas内置函数区分大小写
二、知识吸收
1.读取
- 逐块 chunk:类型——TextFileRaeder;设置——read_csv("path",chunksize= )
2.修改
- 修改索引:df.set_index('乘客ID',inplace=True),inplace=True表示在df上直接修改,丢弃原来索引。
- 更改列名 2种:重命名df的列名df.columns=[ ] ;读取时赋names参数df=pd.read_csv('train.csv',names=[ ])
3.删除/隐藏列
3.1 axis参数含义:axis=1代表列,axis=0代表行
-
指定删除相关的列,没有带columns,所以要指出是哪个轴上的:df.drop(['B', 'C'], axis=1)
-
这里带有columns,所以不用加上axis参数:df.drop(columns=['B', 'C'])
3.2 drop函数的inplace参数
- inplace=True 在原DataFrame修改
- 默认False 仅修改副本
4.条件筛选
单个条件筛选:df[df['Age']<10].head()
多个条件筛选(有括号):df[(df['Age']>10)&(df['Age']<50)].head()
5.行/列的升序/降序
5.1索引的
frame.sort_index(axis=1, ascending=False)
axis默认0代表行,1为列,ascending默认True即升序,False降序
5.2 值的(只能是列的)
text.sort_values(by=['票价', '年龄'], ascending=False)