分类变量的相关统计指标
#对分类变量分类汇总
df['州市'].value_counts()
# 取出分类变量的unique值,并转化为列表
zhous = df['州市'].unique().tolist()
# 查看分类变量的类别数
df['州市'].nunique()
# 取出州市为昆明的数据
df.loc[df['州市'] == '昆明市']
随机抽样并保存结果
对每个州市随机抽取30个样本,并分别保存到同一个excel的不同sheet表中
# 进行随机抽样,并把得到的数据框保存到不同的sheet中
# random.sample只能对一列数据进行取样
# a模式可以将数据写到不同的sheet中
with pd.ExcelWriter('随机采样.xlsx',mode='a',engine='openpyxl') as writer:
for zhou in zhous:
middata = df.loc