我希望这能证明有用,我有这样一个数据帧:#!/usr/bin/python
from numpy import nan
import pandas as pd
my_df=pd.DataFrame({'ID':['Sample1', 'Sample1', 'Sample1', 'Sample1', 'Sample2', 'Sample2', 'Sample2', 'Sample2', 'Sample3', 'Sample3'],
'Purchase':[4, 5, 6, 7, 8, 9, 10, 11, 12, 13],'item':['Item1', 'Item2', nan, 'Item4', 'Item5', 'Item6', 'Item7', nan, nan, nan],})
my_df
ID Purchase item
0 Sample1 4 Item1
1 Sample1 5 Item2
2 Sample1 6 NaN
3 Sample1 7 Item4
4 Sample2 8 Item5
5 Sample2 9 Item6
6 Sample2 10 Item7
7 Sample2 11 NaN
8 Sample3 12 NaN
9 Sample3 13 NaN
第一列中具有重复值的示例可以提取到字典中,然后提取到单独的csv文件中,这些文件也可以与excel一起使用:
^{pr2}$
这将根据第一列中重复的值生成csv文件。在