《机器学习实战》
文章平均质量分 50
冲鸭!!!!!
这个作者很懒,什么都没留下…
展开
-
《机器学习实战》笔记(一)
监督学习:给定输入样本集,机器就可以从中推演出制定目标变量的可能结果 知道预测什么无监督学习:数据没有类别信息,也不会给定目标值。可以减少数据特征的维度 数据集合分成由类似的对象组成的多个类的过程——聚类 寻找描述数据统计值的过程——密度估计监督学习算法:k-近邻算法 ...原创 2018-07-10 15:34:18 · 166 阅读 · 0 评论 -
《机器学习实战》笔记(二)
第二章:k-近邻算法内容:k-近邻分类算法从文本文件中解析和导入数据使用Matplotlib创建扩散图归一化数值 2.1 k-近邻算法概述使用测量不同特征值之间的距离方法进行分类优点:精度高,对异常值不敏感,无数据输入假定缺点:计算复杂度高、空间复杂度高使用数据范围:数值型 & 标称型 工作原理:训练样本集中每个数据都存在标签。 输入没有标签的新数据之后,将新...原创 2018-07-11 16:51:42 · 204 阅读 · 0 评论 -
《机器学习实战》笔记(三) 示例1
使用k-近邻算法改进约会网站的配对效果 一、 准备数据:从文本中解析 1.数据:datingTestSet2.txt :一个数据一行,共1000行 三种特征:飞行里程数 视频游戏耗时 冰淇淋数 2.函数:file2matrix(filename): 使用:datingDataMat, datingLabels = file2matrix(‘datingTestSet2.t...原创 2018-07-26 15:46:57 · 332 阅读 · 0 评论 -
《机器学习实战》笔记(四) 示例2
手写识别系统(仅0-9) 此系统仅能识别0-9,需识别的数字已经使用图像处理软件处理成具有相同色彩和大小:32*32像素的黑白图像,将图像转换为了文本格式。 步骤: 1)收集数据:文本文件 2)准备数据:函数img2vector() 将图像格式转换为分类器使用的向量格式 3)分析数据:在python命令符中检查数据,确保它符合要求 4)训练算法:KNN中不适用 5)测试算...原创 2018-07-27 16:57:44 · 135 阅读 · 0 评论