1. 重置Data.Frame的索引
df = df.reset_index(drop=True)
2. 第1列是否作为索引
## 作为索引
data = pd.read_csv('data.csv',index_col = 0)
## 不作为索引
data = pd.read_csv('data.csv',index_col = False)
3. 取DataFrame指定的列
## 指定1列
data['a']
data.a
## 指定的多列
data[['a','b']]
4. DataFrame列的移动
df = pd.DataFrame(np.random.randn(3,4),colums = ['a','b','c','d'])
c = df.pop('c')
df.insert(4,'c_new',c)
5. 根据某列取值修改另外一列
data.loc[data[data['B' == 0].index,['A']] = 1
6. 修改DataFrame的列名
## 修改原来的列名或者是添加新的列名
df.columns = ['A','B']
## 修改指定的列名
df.renames(columns = {'a':'A'})
7. 计算分位数
a = np.array(list(range(10)))
np.percentile(a,25)
8. 根据某两列值修改第三列值
df.loc[(df.a>=2)&(df.c>=1),'b'] = 0