numpy 部分 numpy doc,注:使用函数的时候注意函数内部参数的使用
查看numpy数组的一些基本信息涉及到的函数:
array.shape(查看数组的形状),
array.ndim(数组维度),
array.dtype(data type),
array.size(数组的大小)
numpy中常用的生成数组的一些函数:
np.ones()
np.zeros
np.random.rand()
np.random.randint()
np.random.random()
np.random.randn()(生成正态分布的数组,直接输入维度即可)
np.linspace()生成等差数组
array11=np.random.randn(3,5)
array11
生成指定范围的数组的内容:np.arange()
查看数组的大小值,均差,方差涉及到的函数:np.max(),np.min(),np.mean(),np.var(),np.std()
pandas review pandas doc
创建一个pandas序列:pd.Series([放入content内容]),创建一个Series序列,重点:series是dataframe的基本构成单位
示例代码
colours=pd.Series(["Blue","Red","White"])
cars=pd.Series(["BMW","Toyota","Honda"])
car_data=pd.DataFrame({"Car_make": cars,
"Colour": colours})
导入csv文件:file=pd.read_csv("文件路径")
导出csv文件:file.to_csv("文件路径")
查看dataframe的一些基本信息涉及到的方法:
describe(),info(),mean(),sum(),head(),tail()
其中比较重要的有loc和iloc的使用
loc:可以使用列名,行名,也可以使用列和行索引
iloc:前面多加的i表示Integer,表示这个只能使用列和行索引
条件查询:
car_sales[car_sales["Odometer (KM)"]>100000]
插入一个匿名函数的用法,使用可以参考此用法
car_sales["Price"]=car_sales["Price"].apply(lambda x:x[1:])
对于dataframe中的空值:可以使用fillna填充或者dropna删除
修改列名的用法
car_sales=car_sales.rename(columns={"Odometer (KM)":"Odometer (Miles)"})
car_sales
最后将修改后的dataframe索引重置,使用reset_index()方法
car_sales_sampled.reset_index()