基于numpy的封装
import pandas
food_info=pandas.read_csv('food_info.csv")
print(type(food_info)
food_info.head(3) 显示前三条数据
food_info.tail(3) 显示后3条数据
food_info.columns 显示列
food_info.loc(0) 显示第1个数据
food_inof.loc[3:6] 3到5数据
columns=[“zinc_(mg)”,copper_(mg)]
zinc_copper=food_info[columns] 输出列名
04排序
food.sort_values("sodium“,inplace=true) 按soium列排序,显示新数据
food.sort_values("sodium“,inplace=true,ascend=false) 按soium列排序,显示新数据,降序操作
age_is_null=pd.isnull() 判断是否缺失值
print(age[age_is_null])
print(len(age)) 输出长度
good_ages=titanic_survival[“age”][age_is_null==false] 去掉缺失值
.mean() 计算均值
passenger_survival=titanic_survival.pivot_table(index=“pclass”,values=”survied",aggfunc=np.mean)
.dropna(axis=0,subset=[‘age’,‘sex’]) 去掉缺失值
自定义函数
reset_index(drop=true) 重新设置index
series结构
相当于矩阵(dataframe)当中的一行或一列