机器学习实战
Colin_DE
Robotics & Computer Vision. Visual SLAM, Deep Learning
展开
-
机器学习 回归问题
一.线性回归线性回归就是将输入项分别乘以一些常量,在将结果加起来得到输出。 假定输入数据存放在矩阵 x 中,而回归系数存放在向量 w 中。 那么预测结果可以通过Y=X的转置*W得出。所以我们求解线性回归模型的核心就在于求解w,如何求呢?首先,我们一定是希望预测出来的值和实际值之间的误差越小越好,所以我们评判w好坏,就可以采用实际值与真实值之差表示,但是这个差有正有负,为了避免正负相互抵消的情况,...原创 2019-12-21 20:27:16 · 287 阅读 · 0 评论 -
机器学习实战 AdaBoost
#机器学习实战 AdaBoost集成方法1 Bagging自举汇聚法(bootstrap aggregating),也称为bagging方法。Bagging对训练数据采用自举采样(boostrap sampling),即有放回地采样数据,主要思想:从原始样本集中抽取训练集。每轮从原始样本集中使用Bootstraping的方法抽取n个训练样本(在训练集中,有些样本可能被多次抽取到,而有些样本...原创 2019-12-13 16:46:57 · 151 阅读 · 0 评论 -
机器学习实战 支持向量机
机器学习实战 支持向量机1.SVM。SVM有很多实现,但是本章只 关注其中流行的一种实现,即序列最小优化①(Sequential Minimal Optimization,SMO)算法。 在此之后,将介绍如何使用一种称为核函数(kernel)的方式将SVM扩展到更多数据集上。后 会回顾第1章中手写识别的例子,并考察其能否通过SVM来提高识别的效果2. 基于最大间隔分隔数据支持向量机优点:...原创 2019-11-30 14:13:40 · 306 阅读 · 0 评论 -
机器学习实战 逻辑回归
机器学习实战 逻辑回归Logistic回归的一般过程(1) 收集数据:采用任意方法收集数据。(2) 准备数据:由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据 格式则最佳。(3) 分析数据:采用任意方法对数据进行分析。(4) 训练算法:大部分时间将用于训练,训练的目的是为了找到最佳的分类回归系数。(5) 测试算法:一旦训练步骤完成,分类将会很快。(6) 使用算法:首先...原创 2019-11-23 15:42:59 · 154 阅读 · 0 评论 -
机器学习实战 朴素贝叶斯
机器学习实战 朴素贝叶斯一. 前言朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法精度在某种程度上受影响。二 朴素贝叶斯理论优点:在数据较少的情况下仍然...原创 2019-11-23 15:22:49 · 181 阅读 · 0 评论 -
机器学习实战 决策树
决策树的构造在构造决策树时,我们需要解决的第一个问题就是,当前数据集上哪个特征在划分数据分类时起决定性作用。为了找到决定性的特征,划分出最好的结果,我们必须评估每个特征。完成测试之后,原始数据集就被划分为几个数据子集。这些数据子集会分布在第一个决策点的所有分支上。如果某个分支下的数据属于同一类型,则当前无需阅读的垃圾邮件已经正确地划分数据分类,无需进一步对数据集进行分割。如果数据子集内的数...原创 2019-11-17 19:59:21 · 156 阅读 · 0 评论 -
机器学习实战 k-近邻算法
这里写自定义目录标题1.k-近邻算法概述2 电影分类判定3 约会网站配对效果判定1.k-近邻算法概述k-近邻算法采用测量不同特征值之间的距离方法进行分类它的工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似...原创 2019-11-17 19:48:53 · 247 阅读 · 0 评论