做相关性分析的方法有很多,这里分享几个相关性分析。
1、GINI系数
什么是基尼系数呢,其实就是P(Y|X)的一种变形,用人话就是说,利用多个标签,是否能区分模型,也就是相关度。
引入示例加深理解
X Y
有钱 老板
有钱 傻逼
没钱 老板
没钱 傻逼
没钱 傻逼
如果他有钱的情况下,他是老板的概率为0.5(二分之一)
他没钱的情况下,他是老板的概率为0.33(三分之一)
所以他的GINI系数为
做相关性分析的方法有很多,这里分享几个相关性分析。
1、GINI系数
什么是基尼系数呢,其实就是P(Y|X)的一种变形,用人话就是说,利用多个标签,是否能区分模型,也就是相关度。
引入示例加深理解
X Y
有钱 老板
有钱 傻逼
没钱 老板
没钱 傻逼
没钱 傻逼
如果他有钱的情况下,他是老板的概率为0.5(二分之一)
他没钱的情况下,他是老板的概率为0.33(三分之一)
所以他的GINI系数为