机器学习
文章平均质量分 73
perfecttshoot
Seize the day! For the better future;
展开
-
机器学习实战(第一篇)-机器学习基础
分解了机器学习的入门基础改变,知道了机器学习的主要任务和目标,知道了一般机器学习的开发步骤。并引入了机器学习的使用工具Python。原创 2017-12-27 20:43:13 · 1383 阅读 · 0 评论 -
机器学习实战(第二篇)-k-近邻算法
本篇文章开始,我们将真实进入机器学习的世界,首先我们本篇介绍的是分类算法中的k-近邻算法。它非常有效而且易于掌握。首先我们将探讨k-近邻算法的基本理论,以及如何使用距离测量的方法分类物品;其次我们将使用Python从文本文件中导入并解析数据;再次,讨论了当存在许多数据来源时,如何避免计算距离时可能碰到的一些常见错误;最后,利用实际的例子讲解如何使用k-近邻算法改进约会网站和手写数字识别系统。原创 2017-12-27 20:56:57 · 310 阅读 · 0 评论 -
机器学习实战(第二篇)-k-近邻算法Python实现
本篇中我们将介绍如何通过Python工具实现一个k-近邻算法。展示k-近邻的基础原理,并给出了使用Python的基本方法。原创 2017-12-28 15:24:29 · 675 阅读 · 0 评论 -
机器学习实战(第二篇)-k-近邻算法改进约会网站配对结果
前面几篇中,我们学习了机器学习算法中k-近邻算法,本章我们将使用该算法进行改进约会网站配对结果的工作。首先我们先进入背景介绍: 我的朋友海伦一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的人选,但她没有从中找到喜欢的人。经过一番总结,她发现曾交往过三种类型的人: 不喜欢的人; 魅力一般的人; 极具魅力的人; 尽原创 2018-01-04 17:01:58 · 1372 阅读 · 0 评论 -
机器学习实战(第二篇)-k-近邻算法开发手写识别系统
上一篇文章中,我们学习了使用k近邻算法改进约会网站,实现了通过一些数据的输入判断人员属于哪一个分类。但是上篇文章基于的数据都是我们能够简单理解的数字信息,本篇文章我们在人不太容易看懂的数据上使用分类器。这篇文章中我们将一步步构造使用k-近邻分类器的手写识别系统。为了简单起见,这里构造的系统只能识别数字0到9。需要识别的数字已经使用图形处理软件,处理成具有相同色彩和大小:宽高是32像素 X 32像素原创 2018-01-05 14:04:13 · 433 阅读 · 0 评论 -
机器学习实战(第三篇)-决策树简介
我们经常使用决策树处理分类问题,近来的调查表明决策树也是最经常使用的数据挖掘算法。它之所以如此流行,一个很重要的原因就是使用者基本上不用了解机器学习算法,也不用深究它是如何工作的。 如果你以前没有接触过决策树,不用担心,它的概念非常简单。即使不知道它也可以通过简单的图形了解其工作原理。下图代表了一个决策树: 正方形代表判断模块(decision block),椭圆代表终止模块原创 2018-01-08 16:56:00 · 385 阅读 · 0 评论 -
机器学习实战(第三篇)-决策树构造
首先我们分析下决策树的优点和缺点。优点:计算复杂度不高,输出结果易于理解,对中间值的却是不敏感,可以处理不相关特征数据;缺点:可能会产生过度匹配问题。适用数据类型:数值型和标称型。 本篇文章我们将一步步地构造决策树算法,并会涉及许多有趣的细节。首先我们先讨论数学上如何使用信息论划分数据集,然后编写将理论应用到具体的数据集上,最后编写代码构建决策树。 在构造决策树时,我们需要解决的第原创 2018-01-08 20:40:50 · 332 阅读 · 0 评论