python计算iv值_Python计算IV值的示例讲解

最新推荐文章于 2024-01-21 17:04:37 发布

刘一树

最新推荐文章于 2024-01-21 17:04:37 发布

阅读量3.1k

点赞数

文章标签： python计算iv值

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32357285/article/details/112931081

版权

本文介绍了Python中计算变量重要性统计量IV值的代码实现，并通过实例讲解了如何计算IV值。此外，还详细阐述了Python中的切片、迭代、生成列表等基本操作，包括对list、tuple、字符串的切片，以及对dict的key和value的迭代方法。最后，展示了列表生成式和条件过滤在数据处理中的应用。

摘要由CSDN通过智能技术生成

在对变量分箱后，需要计算变量的重要性，IV是评估变量区分度或重要性的统计量之一，python计算IV值的代码如下：

def CalcIV(Xvar, Yvar):

N_0 = np.sum(Yvar==0)

N_1 = np.sum(Yvar==1)

N_0_group = np.zeros(np.unique(Xvar).shape)

N_1_group = np.zeros(np.unique(Xvar).shape)

for i in range(len(np.unique(Xvar))):

N_0_group[i] = Yvar[(Xvar == np.unique(Xvar)[i]) & (Yvar == 0)].count()

N_1_group[i] = Yvar[(Xvar == np.unique(Xvar)[i]) & (Yvar == 1)].count()

iv = np.sum((N_0_group/N_0 - N_1_group/N_1) * np.log((N_0_group/N_0)/(N_1_group/N_1)))

return iv

def caliv_batch(df, Kvar, Yvar):

df_Xvar = df.drop([Kvar, Yvar], axis=1)

ivlist = []

for col in df_Xvar.columns:

iv = CalcIV(df[col], df[Yvar])

ivlist.append(iv)

names = list(df_Xvar.columns)

iv_df = pd.DataFrame({'Var': names, 'Iv': ivlist}, columns=['Var', 'Iv'])

return iv_df

其中，df是分箱后的数据集，Kvar是主键，Yvar是y变量(0是好，1是坏)。

代码运行结果如下：

补充拓展：python基础IV(切片、迭代、生成列表)

对list进行切片

取一个list的部分元素是非常常见的操作。比如，一个list如下：

>>> L = ['Adam', 'Lisa', 'Bart', 'Paul']

取前3个元素，应该怎么做？

笨办法：

>>> [L[0], L[1], L[2]]

['Adam', 'Lisa', 'Bart']

之所以是笨办法是因为扩展一下，取前N个元素就没辙了。

取前N个元素，也就是索引为0-(N-1)的元素，可以用循环：

>>> r = []

>>> n = 3

>>> for i in range(n):

... r.append(L[i])

...

>>> r

['Adam', 'Lisa', 'Bart']

对这种经常取指定索引范围的操作，用循环十分繁琐，因此，Python提供了切片(Slice)操作符，能大大简化这种操作。

对应上面的问题，取前3个元素&#

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。