![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 60
Floria_19
十年寒窗,仍为碧手;
万年不待,只争朝夕
展开
-
《机器学习实战》阅读笔记(二)
第二章 k-近邻算法(kNN)2.1k-近邻算法概述定义:采用测量不同特征值之间的距离方法进行分类。优点:精度高,对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型。工作原理:存在一个训练样本集,样本集中的每个数据都存在标签,即我们知道每个数据属于哪个分类。输入没有标签的新数据之后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中...原创 2018-07-09 15:24:53 · 253 阅读 · 0 评论 -
《机器学习实战》阅读笔记(三)
接上篇2.2.3准备数据:归一化数值由于数值较大的值会产生较大的影响,所以需要归一化,公式如下:newValue=(oldValue-min)/(max-min)归一化函数如下def autoNorm(dataSet): minVals=dataSet.min(0) maxVals=dataSet.max(0) ranges=maxVals-minVals norm...原创 2018-07-10 14:16:54 · 253 阅读 · 0 评论 -
《机器学习实战》阅读笔记
第一部分 分类第一章 机器学习基础1.1机器学习的定义Machine learning is a subset of artificial intelligence in the field of computer science that often uses statistical techniques to give computers the ability to "learn" (i.e...原创 2018-07-05 16:04:06 · 214 阅读 · 0 评论 -
精通机器学习:基于R(一)
"诸事皆殚精竭虑者,终将一事无成。"1.定义机器学习:机器学习是使用数据对模型进行的训练,它针对某种性能指标形成决策。2.过拟合和欠拟合偏差是模型的预测值或预测水平与训练数据中的实际值或实际水平之间的差别。方差是训练数据集的预测值或预测水平相对于其他数据集的预测值或预测水平的离散程度。总体误差=偏差+方差第一章 成功之路“如果你不能将要做的事情描述成一个流程,那么你...原创 2018-08-21 16:00:05 · 889 阅读 · 0 评论 -
精通机器学习:基于R(二)
第二章 线性回归:机器学习基础技术2.1单变量回归线性回归必须通过假设检验,总结如下:1)线性:预测变量与响应变量之间的关系是线性的。如果不是线性的要进行数据转换(对数转换、多项式转换、指数转换等)。2)误差不相关:在时间序列和面板数据中,En=BETAn-1是一个常见的问题。3)同方差性:误差是正态分布的,并具有相同的方差。即对于不同的输入值,误差的方差是一个固定值。4)...原创 2018-08-21 18:06:24 · 614 阅读 · 0 评论