前几天做能力验证的题,有道题要求把网页上的数据导出到csv中,实际操作过程中,把网页数据复制到Excel之后,有一列数据出现了跨行的情况,最后颇费了一点周折总算解决了,今天就在这里做一个分享。
如下图,我们看到在详细信息这一列数据里,有部分数据有跨行的情况。
首先我们用ffill函数,对“通道/所属账号”这一列里的数据做向下填充
df1['通道/所属账号'] = df1['通道/所属账号'].ffill()
然后用groupby函数把数据按“通道/所属账号”列的数据分组,和sum函数将同一组的数据进行合并,就能得到我们要的结果。
df2 = df1.fillna('').groupby(['通道/所属账号']).sum()