我有一个像这样的Pandas DataFrame:
id fruits
01 Apple, Apricot
02 Apple, Banana, Clementine, Pear
03 Orange, Pineapple, Pear
如何通过删除重复项来获得像这样的水果列表?
['Apple','Apricot','Banana','Clementine','Orange','Pear','Pineapple']
参考方案
试试这个,
set(', '.join(df['fruits']).split(', '))
输出:
set(['Apple', 'Apricot', 'Pear', 'Pineapple', 'Orange', 'Banana', 'Clementine'])
Python Pandas:按分组分组,平均? - python
我有一个像这样的数据框:cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 我想计算每个集群每个组织的平均时间。预期结果:cluster mean(time) 1 15 ((8+6)/2+23)/2 2 54 (74+34)/2 3 6 我不知道如何在熊猫中做到这一点,有人可以帮忙吗? 参考方案 如…Python Pandas:在多列上建立布尔索引 - python
尽管至少有关于如何在Python的pandas库中为DataFrame编制索引的two good教程