数据处理踩过的坑(不断更新):

1.使用布尔掩码作为索引过滤数据:(4.18)

  • 一、对数组或Series用布尔数组进行过滤,滤去对应位置为False的值,只保留对应位置为True的值:
  1. 对数组:
  2. 对Series:
  • 二、对DataFrame用布尔数组进行过滤,在False的位置填充缺省值(注意区别):
    此时,若想要在特定的某一列中寻找特定的值:
    若想要选取存在绝对值大于1.5的数据的行,通过布尔数组配合any()实现:

总结:若想通过仅布尔数组直接选取特定的值,则布尔数组不能是DataFrame形式

2.DataFrame对象才能使用.join()方法:(4.18)

合并数据集的时候发现报错:

检查发现,
所以,

3.获取DataFrame进行groupby分组后的某一列的两种等效方法:

现在获取按key1分组后的data1这一列数据:

对方法一的理解: 按照groupby()中参数列表对data['data1']这一列进行分组,分组方式与原数据集DataFrame无关,只与groupby()中参数列表有关,故不能省略为groupby('key1'):

对方法二的理解: 先按照groupby()中的参数对原数据集DataFrame进行分组,再从各组中选出data1列,分组方式与原数据集DataFrame有关,故能省略为groupby('key1'):

3.数组拼接时的维度问题:

  • 在拼接数组的时候出现了这么一个错误:

  • 原来是转置后的数组维度与x的维度不匹配,改变创建全一数组的形状或者通过reshape方法可以解决:

  • 拼接成功:

转载于:https://juejin.im/post/5cb883466fb9a0688539b4d7

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值