Python | 机器学习第一弹 (二) 处理和操作数据

这一篇,我们来学习如何处理和操作数据:
1.Map

Map方法适用于序列数据,所以在我们的栗子中将用它来转变数据框的某列,当我们觉得类别的名字太长了,我们想要将它替换,这个时候我们便可以使用Map函数:

我们在Class的这一列运行了Map函数对原来的字符串进行了替换。

2.Apply

我们继续用iris_data的数据,给这个数据新增一列,即花瓣宽度超过平均值的时候,我们判定它为宽花瓣,用1来表示,否则用0来表示:

首先计算得到Petal Width的平均值:

接下来我们开始为其进行分类:

以上是在列上使用apply,下面,我们看如何在数据框上使用:

这里要注意axis=1是对行进行操作,因为我们是对这个数据框操作,所以我们要加上这个条件才能继续执行。

3.Applymap

当我们想对数据框整体进行操作时,我们便可以使用这个函数:

这行代码表示,我们在数据框上调用了applymap函数,如果某个值是float类型,那么就返回该值的对数,因此,我们可以将applymap视为根据一定的条件标准来转变或者格式化每一个单元。

4.Groupby

基于某些你所选择的类别对数据进行分组:

系统按照类别对数据进行了划分,并提供了每个特征的均值。

用.describe()来获得全部的统计信息

groupby是难点也是重点,在以后遇到的时候也会着重在博客中记录一下思路以及做法!

 

转载于:https://www.cnblogs.com/Virtual-Z/p/9684097.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值