numpy&pandas总结

numpy 部分 numpy doc,注:使用函数的时候注意函数内部参数的使用

查看numpy数组的一些基本信息涉及到的函数:

array.shape(查看数组的形状),

array.ndim(数组维度),

array.dtype(data type),

array.size(数组的大小)

numpy中常用的生成数组的一些函数:

np.ones()

np.zeros

np.random.rand()

np.random.randint()

np.random.random()

np.random.randn()(生成正态分布的数组,直接输入维度即可)
np.linspace()生成等差数组
array11=np.random.randn(3,5)
array11

生成指定范围的数组的内容:np.arange()

查看数组的大小值,均差,方差涉及到的函数:np.max(),np.min(),np.mean(),np.var(),np.std()

pandas review pandas doc

创建一个pandas序列:pd.Series([放入content内容]),创建一个Series序列,重点:series是dataframe的基本构成单位

示例代码

colours=pd.Series(["Blue","Red","White"])
cars=pd.Series(["BMW","Toyota","Honda"])
car_data=pd.DataFrame({"Car_make": cars,
                      "Colour": colours})

导入csv文件:file=pd.read_csv("文件路径")

导出csv文件:file.to_csv("文件路径")

查看dataframe的一些基本信息涉及到的方法:

describe(),info(),mean(),sum(),head(),tail()

其中比较重要的有loc和iloc的使用

loc:可以使用列名,行名,也可以使用列和行索引

iloc:前面多加的i表示Integer,表示这个只能使用列和行索引

条件查询:

car_sales[car_sales["Odometer (KM)"]>100000]

插入一个匿名函数的用法,使用可以参考此用法

car_sales["Price"]=car_sales["Price"].apply(lambda x:x[1:])

对于dataframe中的空值:可以使用fillna填充或者dropna删除

修改列名的用法

car_sales=car_sales.rename(columns={"Odometer (KM)":"Odometer (Miles)"})
car_sales

最后将修改后的dataframe索引重置,使用reset_index()方法

car_sales_sampled.reset_index()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值