目的是:将一组数据里,连续并且重复3次以上的数据进行提取
df[“column_name”].diff().ne(0).cumsum()参考博客
对函数进行解读
- diff()——计算相邻两条数据的差
- ne(0)——判断是否为0,不等于0则输出“True“,否则是”False“
- cumsum()——累加
我们拿到一组数据如下,若要按num值进行groupby,势必会把前4个和后面的几个101划分成了一组,
对函数进行解读
我们拿到一组数据如下,若要按num值进行groupby,势必会把前4个和后面的几个101划分成了一组,