机器学习最常用算法原理理解 | PCA、随机森林、AdaBoost

最新推荐文章于 2024-03-06 18:16:50 发布

大数据AI笔记

最新推荐文章于 2024-03-06 18:16:50 发布

阅读量2.4k

点赞数 1

分类专栏：机器学习文章标签：机器学习 PCA 随机森林 adabost 算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30262201/article/details/79547910

版权

机器学习专栏收录该内容

34 篇文章 99 订阅 ¥49.90 ¥99.00

订阅专栏

一、PCA

将一组N维向量降为K维，其目标是选择K个单位正交基，使得原始数据变换到这组基上后，各字段两两间协方差为0，而字段的方差则尽可能大（在正交的约束下，取最大的K个方差）。

算法步骤：

设有m条n维数据。

1.将原始数据按列组成n行m列矩阵X

2.将X的每一行（代表一个属性字段）进行零均值化，即减去这一行的均值

3.求出协方差矩阵

4.求出协方差矩阵的特征值及对应的特征向量

5.将特征向量按对应特征值大小从上到下按行排列成矩阵，取前k行组成矩阵P

6.Y=PX即为降维到k维后的数据

二、随机森林

随机森林算法步骤：

1.从样本集中通过重采样的方式产生n个样本

2.假设样本特征数目为a，对n个样本选择a中的k个特征，用建立决策树的方式获得最佳分割点

3.重复m次，产生m棵决策树

4.多数投票机制来进行预测

需要注意的一点是，这里m是指循环的次数，n是指样本的数目，n个样本构成训练的样本集，而m次循环中又会产生m个这样的样本集

决策树算法步骤

1.对于每一个特征，找到一个使得Gini值最小的分割点（这个分割点可以是>,<,>=这样的判断，也可以是=，!=），然后比较每个特征之间最小的Gini值，作为当前最优的特征的最优分割点（这实际上

了解本专栏

大数据AI笔记

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
2
评论
机器学习最常用算法原理理解 | PCA、随机森林、AdaBoost

一、PCA将一组N维向量降为K维，其目标是选择K个单位正交基，使得原始数据变换到这组基上后，各字段两两间协方差为0，而字段的方差则尽可能大（在正交的约束下，取最大的K个方差）。算法步骤：设有m条n维数据。1.将原始数据按列组成n行m列矩阵X2.将X的每一行（代表一个属性字段）进行零均值化，即减去这一行的均值3.求出协方差矩阵4.求出协方差矩阵的特征值及对应的特征向量...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大数据AI笔记 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。