M_learning
文章平均质量分 87
zjd873721519
这个作者很懒,什么都没留下…
展开
-
统计学习方法(李航) 第一章 统计学习方法概论(1)
1.目前技能水平已入门python,具备独立web开发能力,每天阅读技术书籍一章的习惯,现确定目标为机器学习算法方向。 2.统计学习又称为统计机器学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析与预测中去。 3.监督学习统计学习方法包括监督学习、非...原创 2018-11-27 13:57:16 · 572 阅读 · 0 评论 -
零基础实战机器学习 k-临近算法(初试)
1.目前技能状态主要做web开发,有一定的服务器项目部署经验,使用的数据库有:mysql/sqlite/redis 2.优点精度高对异常值不敏感无数据输入假定 3.缺点计算复杂度高空间复杂度高 4.算法公式此算法的要点就是测量不同特征之间的距离(上面的公式是两个维度的计算公式,特征可以是多个维度)通用公式应该这样写, 5.计算...原创 2018-11-20 16:38:13 · 832 阅读 · 0 评论 -
机器学习实战 第1章 机器学习基础
1.机器学习的用途机器学习分两类:监督学习和非监督学习监督学习主要解决以下三个问题:-->离散变量的分类问题-->连续变量的回归问题-->序列变量的标注问题 第一章只是一个简介。...原创 2018-12-12 17:19:56 · 133 阅读 · 0 评论 -
机器学习实战 第2章 k-近邻算法
1.k-近邻算法概述采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复制度高。适用数据范围:数值型和标称型 2.k-近邻算法原理存在一个样本数据集合,也称作样本数据集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应...原创 2018-12-13 16:11:42 · 165 阅读 · 0 评论 -
机器学习实战 第3章 决策树
1.决策树k-近邻算法可以完成很多分类任务,但是它最大的缺点就是无法给出数据的内在含义,决策树的主要优势就在于数据形式非常容易理解。优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。缺点:可能会产生过度匹配问题。适用数据类型:数值型和标称型。 2.信息增益划分数据集的大原则是:将无序的数据变得更加有序。在划分数据集之前之后信息...原创 2018-12-14 18:30:07 · 195 阅读 · 0 评论 -
机器学习实战 第4章 基于概率论的学习方法:朴素贝叶斯(一)
1.朴素贝叶斯首先从一个最简单的概率分类器开始,然后给出一些假设来学习朴素贝叶斯分类器。称之为‘朴素’,是因为整个形式过程只做最原始、最简单的假设。优点:在数据较少的情况下仍然有效,可以处理多类别的问题。缺点:对于输入数据的准备方式较为敏感。适用数据类型:标称型类型。 2.贝叶斯决策理论假设现在我们有一个数据集,它由两类数据组成,数据分布如下图,用p1(x,...原创 2018-12-20 18:17:04 · 238 阅读 · 0 评论