1.pandas
1.1 pandas.crosstab
- 求解交叉占比,crosstab比pivot_table更简洁。
- pivot_table,代码和结果如下:
tmp = pd.pivot_table(data=datas,values='loan_no',index='live_build_type',columns='y_m3Worse',aggfunc=len,margins=True)
tmp['0_ratio'] = tmp2[0]/tmp2['All']
tmp['1_ratio'] = tmp2[1]/tmp2['All']
3. crosstab,代码和结果如下:
tmp = pd.crosstab(datas['live_build_type'], datas['y_m3Worse'], normalize='index')