特征挖掘
文章平均质量分 94
lanyuelvyun
互金公司风控算法工程师
展开
-
风控信贷模型(一):特征分析
一 特征工程1、初步分析阶段数据的探索分析EDA,是对数据进行初步的统计分析,统计数据的分布、异常、相互关系,目标是让我们了解这些数据能告诉我们什么。可以用来指导我们进行模型的选择,比如说帮助我们初步的决定哪些特征需要被使用,哪些特征需要被剔除。1、准备好样本、特征、label 2、查看样本集中样本总个数、特征总个数 3、查看正负样本个数,如果正负样本相差不多,则属于样本均衡的建模...原创 2018-08-28 19:50:22 · 8304 阅读 · 0 评论 -
PCA:详细解释主成分分析
1 PCA目的/作用主成分分析算法(PCA)是最常用的线性降维方法,它的目标是通过某种线性投影,将高维的数据映射到低维的空间中,并期望在所投影的维度上数据的信息量最大(方差最大),以此使用较少的数据维度,同时保留住较多的原数据点的特性。PCA降维的目的,就是为了在尽量保证“信息量不丢失”的情况下,对原始特征进行降维,也就是尽可能将原始特征往具有最大投影信息量的维度上进行投影。将原特征投影到...原创 2018-09-04 15:33:33 · 215315 阅读 · 71 评论