python
文章平均质量分 82
Floria_19
十年寒窗,仍为碧手;
万年不待,只争朝夕
展开
-
《机器学习实战》阅读笔记(二)
第二章 k-近邻算法(kNN)2.1k-近邻算法概述定义:采用测量不同特征值之间的距离方法进行分类。优点:精度高,对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型。工作原理:存在一个训练样本集,样本集中的每个数据都存在标签,即我们知道每个数据属于哪个分类。输入没有标签的新数据之后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中...原创 2018-07-09 15:24:53 · 272 阅读 · 0 评论 -
《机器学习实战》阅读笔记(三)
接上篇2.2.3准备数据:归一化数值由于数值较大的值会产生较大的影响,所以需要归一化,公式如下:newValue=(oldValue-min)/(max-min)归一化函数如下def autoNorm(dataSet): minVals=dataSet.min(0) maxVals=dataSet.max(0) ranges=maxVals-minVals norm...原创 2018-07-10 14:16:54 · 293 阅读 · 0 评论 -
《机器学习实战》阅读笔记
第一部分 分类第一章 机器学习基础1.1机器学习的定义Machine learning is a subset of artificial intelligence in the field of computer science that often uses statistical techniques to give computers the ability to "learn" (i.e...原创 2018-07-05 16:04:06 · 234 阅读 · 0 评论