1.源数据:
2.这里的目的是先按user_id去分组,然后统计books列里没有重复值的数据,所以这里设置了两条重复的数据。
预期输出:
user1有2个不重复的books值
user2有3个不重复的books值
user3有1个不重复的books值
3.读取数据
import pandas as pd
df = pd.read_excel('测试nuique.xlsx')
4.nunique函数使用:
df.groupby('user_id').nunique()['books']
输出结果:
结果与预期相同。