rrrrrz-CSDN博客

原创机器学习笔记：KNN

KNN1 简介 K最近邻(k-Nearest Neighbor，KNN)分类算法，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。该方法的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。2 原理及代码2.1 关于机器学习首先，机器学习的英文名称叫Machine Lear...

2018-07-11 22:03:00 281

原创 logicstic回归

机器学习笔记：logistic回归1 简介首先抛出一个问题：什么是回归？假设现在有一些数据点，我们用一条直线对这些点进行拟合，这个拟合过程就称作回归。在logistic回归中，我们依据现有数据对分类边界线建立回归公式，并以此进行分类。2 模型原理与算法实现2.1 sigmoid函数我们需要一个函数，能接收所有输入然后预测其类别。例如，在两...

2018-07-10 00:04:46 1018

原创朴素贝叶斯

机器学习：朴素贝叶斯1 简介本章我们介绍的是朴素贝叶斯模型，这是一种基于数学理论而产生的分类模型，在原理上简明易懂。2 原理及算法2.1 条件概率朴素贝叶斯模型的存在基于贝叶斯公式： ) 是指在发生事件的前提下发生事件的概率。这一公式最早由18实际的神学家贝叶斯提出,故名“贝叶斯公式”。2.2 方法依靠贝叶斯公式，我们...

2018-07-08 23:36:10 260

原创机器学习：决策树

1 简介决策树是一种树形结构，由决策树的根结点到叶结点的每一条路径构建一条规则；路径上的内部结点的特征对应着规则的条件，而叶结点对应着分类的结论。2 算法2.1 树的构建在构造决策树时，第一个需要解决的问题就是，如何确定出哪个特征在划分数据分类是起决定性作用，或者说使用哪个特征分类能实现最好的分类效果。这样，为了找到决定性的特征，划分川最好的结果，我们就需要...

2018-07-07 23:57:34 227

原创机器学习笔记：主成分分析

机器学习：主成分分析1 简介降维是对数据高维度特征的一种预处理方法。降维是将高维度的数据保留下最重要的一些特征，去除噪声和不重要的特征，从而实现提升数据处理速度的目的。在实际的生产和应用中，降维在一定的信息损失范围内，可以为我们节省大量的时间和成本。降维也成为了应用非常广泛的数据预处理方法。降维具有如下一些优点：（1）使得数据集更易使用（2）降低算法...

2018-06-09 12:53:17 608 1

原创关于Kaggle-Titanic: Machine Learning from Disaster的机器学习报告（初稿）

关于Kaggle-Titanic: Machine Learning from Disaster的机器学习报告1 问题介绍&nbsp;&nbsp;&nbsp;&nbsp;泰坦尼克号，1912年4月2日完工试航，是当时世界上体积最庞大、内部设施最豪华的客运轮船，有“永不沉没”的美誉。然而在她的处女航中，泰坦尼克号与一座冰山相撞，2224名船员及乘客中，逾1500人丧生。 ...

2018-06-02 22:59:17 714 3

原创机器学习学习笔记：K均值算法

机器学习学习笔记：K均值算法1 简介我们之前接触的所有机器学习算法都有一个共同特点，那就是分类器会接受2个向量：一个是训练样本的特征向量X，一个是样本实际所属的类型向量Y。由于训练数据必须指定其真实分类结果，因此这种机器学习统称为有监督学习然而有时候，我们只有训练样本的特征，而对其类型一无所知。这种情况，我们只能让算法尝试在训练数据中寻找其内部的结构，试图将其类别挖掘出来...

2018-06-02 22:57:51 414 1

原创学习笔记：线性回归

回归1 简介回归是监督学习的另一个内容。与分类问题不同的是，分类问题的目标变量是标称型数据，或者离散型数据。而回归的目标变量为连续型，也即是回归对连续型变量做出预测。解决回归问题最直接的办法是依据输入写出一个目标值的计算公式，这样，对于给定的输入，利用该公式可以计算出相应的预测输出。这个公式称为回归方程，而求回归方程显然就是求该方程的回归系数，而一旦有了这些回归系数，再给定输入...

2018-05-30 00:57:23 1135 1

原创学习笔记：Adaboost

Adaboost学习笔记最近在看《机器学习实战》这本书，这次看到了Adaboost的章节，下面是关于我学习时的笔记简介AdaBoost算法是集成学习的一种。集成学习就是构建多个“基学习器”，之后再将它们结合来完成学习任务的方法。集成学习通过将多个学习器进行综合，其性能通常比单个学习器要好。我们之前提过的随机森林就是集成学习的一种。bagging方法　　在介绍adaBoost...

2018-05-26 02:38:53 247

原创支持向量机学习笔记-1

这篇文章主要记述了我在支持向量机时学到的各种知识，也希望对学习支持向量机的各位读者有所帮助。（一）简述首先考虑最简单的情况：在二维平面上有一组点,他们分别属于类别1和类别2，我们试图寻找一条直线，使得两个类别的点分别落到直线的两边，这就是支持向量机的基本思想。我们约定：能够使得所有点到这条直线的距离的最小值最大的直线就是最优的划分直线，我们称之为超平面，而得出最短距离的这些点称作支持向...

2018-05-21 03:52:10 541 9

qq_35693580的博客