机器学习
无语_人生
现在付出的所有努力,只为将来有机会能选择自己喜欢做的事。
展开
-
SVM理解
本文转自:点击打开链接文章是从微信公众号看到的,个人觉得对于理解支持向量机以及与Logistic之间的联系有一定的帮助,所以转载备后续学习。1 简介支持向量机基本上是最好的有监督学习算法了。最开始接触SVM是去年暑假的时候,老师要求交《统计学习理论》的报告,那时去网上下了一份入门教程,里面讲的很通俗,当时只是大致了解了一些相关概念。这次斯坦福提供的学习材料,让我重新学习了一些SVM知识。我看很多正...转载 2018-04-25 10:07:41 · 160 阅读 · 0 评论 -
朴素贝叶斯分类器--个人笔记
朴素贝叶斯分类器作为基于贝叶斯定理的监督学习算法,曾入选“数据挖掘十大算法”。本文结合个人学习笔记和scikit-learn中朴素贝叶斯算法的官方文档,总结朴素贝叶斯算法的基本思想原理和scikit-learn中三种类型的朴素贝叶斯分类器的适用范围,供以后学习使用。朴素贝叶斯分类算法的基本原理:最小化分类错误率的最优贝叶斯分类是使后验概率P(y|x)最大化,即:根据贝叶斯公式:朴素贝叶斯假设每个样...原创 2018-04-25 17:54:47 · 798 阅读 · 0 评论 -
集成学习-个人笔记
集成学习通过某种策略对单个学习器进行结合,通常可获得比单一学习器显著优越的泛化性能,因此在许多学习任务当中都应用了集成学习。本文先介绍集成学习的基本理论思想,再结合scikit-learn官方文档给出常见的几种集成学习算法的Python实现。集成学习的一般结构:先产生一组“个体学习器”,再用某种策略将它们结合起来。若集成中只包含同类型的学习器,这样的集成就是“同质”的,每一单个学习器称为“基学习器...原创 2018-04-26 16:16:14 · 438 阅读 · 0 评论 -
聚类-个人笔记
聚类是无监督学习的一种,目标是对无标记训练样本的学习来解释数据的内在性质及规律,为进一步的数据分析提供基础。聚类算法涉及的两个基本问题:性能度量和距离计算性能度量的指标可分为外部指标和内部指标,外部指标主要有JC系数、FM系数、Rand指数等,而内部指标主要有DB指数、Dunn指数等,此不再详细阐述。距离度量:闵科夫斯基距离:当P=2时就是熟悉的欧氏距离;P=1时称作曼哈顿距离。这里需要注意,闵科...原创 2018-05-15 17:18:15 · 341 阅读 · 0 评论