1.使用布尔掩码作为索引过滤数据:(4.18)
- 一、对数组或Series用布尔数组进行过滤,滤去对应位置为False的值,只保留对应位置为True的值:
- 对数组:
- 对Series:
- 二、对DataFrame用布尔数组进行过滤,在False的位置填充缺省值(注意区别): 此时,若想要在特定的某一列中寻找特定的值: 若想要选取存在绝对值大于1.5的数据的行,通过布尔数组配合any()实现:
2.DataFrame对象才能使用.join()方法:(4.18)
合并数据集的时候发现报错:
检查发现, 所以,3.获取DataFrame进行groupby分组后的某一列的两种等效方法:
现在获取按key1分组后的data1这一列数据: 对方法一的理解: 按照groupby()中参数列表对data['data1']这一列进行分组,分组方式与原数据集DataFrame无关,只与groupby()中参数列表有关,故不能省略为groupby('key1'): 对方法二的理解: 先按照groupby()中的参数对原数据集DataFrame进行分组,再从各组中选出data1列,分组方式与原数据集DataFrame有关,故能省略为groupby('key1'):3.数组拼接时的维度问题:
- 在拼接数组的时候出现了这么一个错误:
- 原来是转置后的数组维度与x的维度不匹配,改变创建全一数组的形状或者通过reshape方法可以解决:
- 拼接成功: