交叉表是用于统计分组频率的透视表。如下先创建一个DataFrame
import pandas as pd
from pandas import DataFrame
df = DataFrame({'类别':['水果','水果','水果','蔬菜','蔬菜','肉类','肉类'],
'产地':['美国','中国','中国','中国','新西兰','新西兰','美国'],
'水果':['苹果','梨','草莓','番茄','黄瓜','羊肉','牛肉']})
df.head()
利用交叉表查看产地和水果的频率统计,即以产地为行索引,水果为列索引。可以看到中国不产牛肉、羊肉、黄瓜。
pd.crosstab(df['产地'], df['水果'])