博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python计算IV值及使用
阅读量:6609 次
发布时间:2019-06-24

本文共 953 字,大约阅读时间需要 3 分钟。

更多风控建模、大数据分析等内容请关注公众号《大数据风控的一点一滴》

在对变量分箱后,需要计算变量的重要性,IV是评估变量区分度或重要性的统计量之一,python计算IV值的代码如下:

def CalcIV(Xvar, Yvar):    N_0  = np.sum(Yvar==0)   N_1 = np.sum(Yvar==1)   N_0_group = np.zeros(np.unique(Xvar).shape)   N_1_group = np.zeros(np.unique(Xvar).shape)   for i in range(len(np.unique(Xvar))):       N_0_group[i] = Yvar[(Xvar == np.unique(Xvar)[i]) & (Yvar == 0)].count()       N_1_group[i] = Yvar[(Xvar == np.unique(Xvar)[i]) & (Yvar == 1)].count()   iv = np.sum((N_0_group/N_0 - N_1_group/N_1) * np.log((N_0_group/N_0)/(N_1_group/N_1)))   return  iv   def caliv_batch(df, Kvar, Yvar):   df_Xvar = df.drop([Kvar, Yvar], axis=1)   ivlist = []   for col in df_Xvar.columns:       iv = CalcIV(df[col], df[Yvar])       ivlist.append(iv)   names = list(df_Xvar.columns)   iv_df = pd.DataFrame({'Var': names, 'Iv': ivlist}, columns=['Var', 'Iv'])   return iv_df

其中,df是分箱后的数据集,Kvar是主键,Yvar是y变量(0是好,1是坏)。代码运行结果如下:

python计算IV值及使用

转载于:https://blog.51cto.com/6093943/2120626

你可能感兴趣的文章
【前端笔记】彻底理解变量与函数的声明提升
查看>>
Android 反编译利器,jadx 的高级技巧
查看>>
Android官方架构组件LiveData: 观察者模式领域二三事
查看>>
[Android组件化]组件化数据分享
查看>>
你必须知道的HTTP基本概念
查看>>
当下拉列表数据过大时,该如何应对?
查看>>
使用OpenGrok搭建 可搜索可跳转的源码 阅读网站
查看>>
Android ContentProvider调用报错"Bad call:..."及相关Binder权限问题分析
查看>>
配置通过VLANIF实现跨设备VLAN内通信
查看>>
Linux-正则表达式
查看>>
基本shell脚本的编辑及变量
查看>>
加密和解密 tar
查看>>
[李景山php]每天TP5-20161216|thinkphp5-helper.php-1
查看>>
VMware、Workstation 使用
查看>>
用户输入和while循环
查看>>
将datatable 保存为 Excel文件(高效率版本)
查看>>
C/C++五大内存分区(转)
查看>>
System V 共享内存区
查看>>
springmvc_1(hello world)
查看>>
0.随笔——读后感
查看>>