机器学习
行歌er
因个人原因,暂不维护该博客
展开
-
机器学习笔记(一)——基于单层决策树的AdaBoost算法实践
基于单层决策树的AdaBoost算法实践 最近一直在学习周志华老师的西瓜书,也就是《机器学习》,在第八章集成学习中学习了一个集成学习算法,即AdaBoost算法。AdaBoost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。 AdaBo...原创 2018-03-06 20:49:36 · 5308 阅读 · 2 评论 -
机器学习笔记(二)——广泛应用于数据降维的PCA算法实战
最近在学习的过程当中,经常遇到PCA降维,于是就学习了PCA降维的原理,并用网上下载的iris.txt数据集进行PCA降维的实践。为了方便以后翻阅,特此记录下来。本文首先将介绍PCA降维的原理,然后进入实战,编写程序对iris.数据集进行降维。一、为什么要进行数据降维? 在数据处理中,经常会遇到特征维度比样本数量多得多的情况,如果直接放到机器学习算法中,效果不一定好。一是因为冗余的特征...原创 2018-03-09 15:02:08 · 1738 阅读 · 0 评论 -
机器学习笔记(三)——Logistic Regression 的原理以及代码实现
假设现在有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作回归。利用Logistic 回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。这里的“ 回归“一词源于最佳拟合,表示要找到最佳拟合参数集,其背后的数学分析将在下面介绍。训练分类器的做法就是寻找最佳拟合参数,使用的是梯度下降法,本文首先阐述Logistic 回归...原创 2018-03-12 22:03:57 · 4449 阅读 · 4 评论