![b5f6efb13b6e643c89ae08c589c7d57b.png](https://img-blog.csdnimg.cn/img_convert/b5f6efb13b6e643c89ae08c589c7d57b.png)
pandas是机器学习中最常用的数据处理库,那么一些高级技巧你是否了解呢?
apply函数
pandas中的lambda函数可以说是最有用的功能之一,也是我的最爱。自由度很高,你可以对自己的数据进行各种操作了。该函数如下:
DataFrame
一般来说我们只使用前面的几个参数,func传入你想要对数据实施的函数,axis=0表示对行操作,axis=1表示对列操作,举一个用法:
df
上面的代码通过传入lambda函数对整列数据进行操作,你可以随意定义你的函数来实现各种功能。
按照条件筛选
pandas具有强大的筛选功能,组合使用可以快速得到你想要的数据
df
修改某一列的格式
比如说我想把某一列的str格式的数字转为float,则可以使用astype轻松实现:
df
统计类别
想要统计一列中有哪些属性?使用value_counts即可轻松实现:
df
保存格式的选择
pandas的保存相信大家都不陌生,但是事实上保存操作中有很多参数是可以配置的,这样可以导出你想要的格式
selected_data
一个常用参数是index,pandas在导出表格时会默认在前面加上一列Index,通常我们可以吧它设为False,因为这个index没什么用;另一个常用参数是header, 表示的是是否输出表头,可根据实际情况设置