# 统计某个字段下有哪些类别及数量
df['category'].value_counts()
# 将多个相同的 df 合并
https://blog.csdn.net/qq_41853758/article/details/83280104
# 空值处理
# https://blog.csdn.net/lwgkzl/article/details/80948548
# 去除含有空值的行,并直接在原数据(df)上修改
df.dropna( inplace = True )
# 重置索引 reset_index
# https://blog.csdn.net/lujiandong1/article/details/52929090
# https://www.cnblogs.com/keye/p/11229863.html
# 重置一下索引,inplace=True 在原数据(df_pro)上修改;
# 不想保留原来的index,drop=True
df_pro.reset_index( inplace = True, drop = True)
# 设置显示宽度
pd.set_option('display.max_colwidth', 170)
# 设置行数全部显示
pd.set_option('display.max_rows', None)
# 取交集
https://www.cnblogs.com/kaerxifa/p/13155768.html
pd.merge(df1,df2)
# 取差集
https://www.cnblogs.com/jaysonteng/p/12360604.html
# 从 dataframe 里挑选特定的行
# 挑选id值为0、3、4、11的行
df[ df['id'].isin( [0, 3, 4, 11] ) ]
# 另一种写法
df[ df.id.isin( [0, 3, 4, 11] ) ]