import numpy as np
import pandas as pd
- np.arrage(num)生成一个 0~num-1 的List
- np.random.shuffle[list] 将list的内部顺序完全打乱,该方法无返回值,直接调用即可,调用完List就会改变
- pd.DataFrame.head()打印df的前五行
- pd.DataFrame.tail()打印df的最末尾五行
- pd.DataFrame.describe(),将该列数据的count,mean,std,max,min,25%分位数,50%分位数,75%分位数打印
- pd.DataFrame.values()返回一个numpy.ndarray,其值为DataFrame中的值(要和dict.values()进行区分,它返回的是一个List)
- np.ndarray.tolist()将ndarray转化为List
- pd.DataFrame.groupby() 将相同名称的项聚成一类 在groupby()后面可以用mean() std() sum()等计算该类的特征
df.groupby('order')["ext price"].sum()
-
计算出的特征如何与原始数据结合呢 使用df.merge('new dataframe name')
df1 = df.merge('new dataframe name')