python_画直方图,查看分布对比图

python_画直方图,查看分布对比图

画子图,查看分布对比图
data_temp = data
# 分布对比图
def fea_diff(label,fea,fea_name,bins,ran,ran_limit,log):
    data = pd.DataFrame({'fea':fea,'label':label})
    #nrows, ncols : int, optional, default: 1  Number of rows/columns of the subplot grid.
    #True or 'all': x- or y-axis will be shared among all subplots.
    
    fig,(ax0,ax1) = plt.subplots( nrows=2,sharex=True,figsize = (12,8))
    #调整子图位置
    plt.subplots_adjust(hspace=0)
    data = data.fillna(0)
    if ran_limit==False:
        ran = [min(data.fea),max(data.fea)] 
    #画直方图    
     #x : (n,) array or sequence of (n,) arrays    
     # bins : int or sequence or str, optional    
    ax0.hist(data.loc[(data.label==1),'fea'],bins=bins,alpha=0.5,range=ran,normed = False,log=True)
    ax0.set_ylabel('count',fontsize=20)
    ax0.legend(['label = 1'],loc = 9,fontsize=20)
    ax0.tick_params(labelsize = 20)
    ax0.grid()

    ax1.hist(data.loc[(data.label==0),'fea'],color='r',bins=bins,alpha=0.5,range=ran,normed = False,log=True)
    ax1.set_xlabel(fea_name,fontsize=20)
    ax1.set_ylabel('count',fontsize=20)
    ax1.legend(['label = 0'],loc = 9,fontsize=20)
    ax1.tick_params(labelsize = 20)
    ax1.grid()
    


fea_diff(label = (data_temp.loan_cur_balance<1000000),#标签列
         fea = data_temp.loan_cur_balance, #特征列
         fea_name = 'loan_cur', #特征名
         bins = 50, #分桶数
         ran_limit=False, #是否启用范围限制
         ran = [0,0], #数据范围
         log = False #是否对纵轴取对数
         )

在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值