机器学习
廖先贵
致力于金融风控、机器学习、存储。欢迎交流:liaoxiangui@126.com
展开
-
optics算法
1 简介 随着数据爆发式增长,分析数据从而提取隐藏在数据中的信息变的越来越重要。聚类分析是数据分析的一个主要方法,聚类(clustering)是将数据对象进行分类的过程,使同一类中的对象之间具有很高的相似度,而不同类中的对象高度相异。与分类不同,聚类不依赖预先定义的类和类标号,属于观察式学习。简而言之,在聚类中,分类的标准和类型数量均是未知的。 近来聚类分析算法原创 2012-11-25 21:31:26 · 7007 阅读 · 0 评论 -
数据挖掘模型中的IV和WOE详解
1.IV的用途IV的全称是Information Value,中文意思是信息价值,或者信息量。我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我们有200个候选自变量,通常情况下,不会直接把200个变量直接放到模型中去进行拟合训练,而是会用一些方法,从这200个自变量中挑选一些出来,放进模型,形成入模变量列表。那么我们怎么去挑选入模变量呢?挑选入模变量过程是个比较复...转载 2018-06-08 13:45:49 · 414 阅读 · 0 评论