书生打柴-CSDN博客

原创 ML on Imbalance Data

Machine Learning Project on Imbalance Data（不平衡类的处理）原文本文是阅读上述原文后，自己做的缩略版版笔记，希望对大家有所帮助。这篇文章看似是专门讲不平衡分类问题，但是实际上里面的步骤对于一个机器学习项目都是适用的，只不过在某些过程的处理上，有一些特殊的trick而已。 Imbalance data Examples fraud(诈骗) detection

2016-09-22 17:19:46 1123

转载主成分分析和因子分析十大不同

主成分分析和因子分析无论从算法上还是应用上都有着比较相似之处，本文结合以往资料以及自己的理解总结了以下十大不同之处，适合初学者学习之用。 1.原理不同主成分分析基本原理：利用降维（线性变换)的思想，在损失很少信息的前提下把多个指标转化为几个不相关的综合指标（主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能（主成分

2015-05-05 22:09:10 819

转载数据统计分析的归一化问题

为什么需要归一化？答： 1、我认为归一化的表述并不太准确，按统计的一般说法，叫标准化。数据的标准化过程是减去均值并除以标准差。而归一化仅包含除以标准差的意思或者类似做法。 2、做标准化的原因是：减去均值等同于坐标的移动，把原始数据点的重心移到和原点重合，这样利于很多表达，比如数据的协方差矩阵可以写成XX'，若没有减去均值，则XX‘后面还要减去一些东西（还不明白可以参考多元统计分析的书）。除

2015-05-05 21:04:55 5523

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 ML on Imbalance Data

转载 主成分分析和因子分析十大不同

转载 数据统计分析的归一化问题

空空如也

空空如也

转载主成分分析和因子分析十大不同

转载数据统计分析的归一化问题