python数据处理常用类和函数

总结实际应用中python数据处理时常用的一些类和函数,持续更新...

一,文件读取

pandas.read_csv('filename')  返回一个DataFrame。

 

二,数据定位,选中

DataFrame[ "label" or ["label1", "label2", ...] or [row1,row2,..] ] 选中指定标签列或指定行。

DataFrame["label"]==xxx 返回一列标签,长度与DataFrame[ label ]一样长度的DataFrame,各label下的值为条件语句的结果True/False。

DataFrame[DataFrame["label"]==xxx] 选中所有满足条件的行。

DataFrame.loc[指定行,label] 选中指定行和列的部分,指定行的方式可以为布尔语句或list, 指定列的方式只能是指定label。

DataFrame.iloc[指定行,index] 选中指定行和列的部分,指定行的方式可以为布尔语句或list, 指定列的方式只能是指定index。

DataFrame.head(n)   选中头n行。

DataFrame.isnull() 返回具有相同label的DataFrame,各label下的值为True:原DataFrame中该位置的值空缺,False:非空缺。

三, 统计

DataFrame.max/min/mean/median/...(axis, skipna) 返回沿指定轴的reduced DataFrame。

四,缺失值处理

DataFrame.drop() 删除有缺失值的行/列。

DataFrame.fillna() 用指定值填充。

DataFrame. interpolate() 用插值填充,插值方法可以通过method选择。

 

五,数据转换

DataFrame[label] = DataFrame[label].apply(lambda x: your function)  万能写法,对各label下的值应用指定函数。

例如将得到字符串长度 df["namelen"] = df["name"].apply(lambda x:len(x))。

六, 画图

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值