机器学习
文章平均质量分 89
Gedeon
找个地方做笔记。。。
展开
-
1、何谓机器学习
何为机器学习 简单的来说,机器学习就是把无序的数据转换成有用的信息机器学习横跨多个领域,可以这样说,机器学习对于任何需要解释并操作数据的领域都大有裨益。 训练集: 是用来训练机器学习算法的数据样本集合, 表1-1是包含6个训练样本的训练集 特征/属性:特征或属性通常是训练样本集的列,它们是独立测量得到的结果,多个特征联系在一起共同组成一个训练集 目标变量:目标变量是机器学习算法的...原创 2018-04-11 19:26:36 · 231 阅读 · 0 评论 -
2、K-近邻算法之约会网站预测
k-近邻算法概述 定义:简单地说,k近邻算法采用测量不同特征值之间的距离进行分类 原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系,输入没有标签的新数据后,将新数据的特征与样本集中数据对应的特征进行比较,然后计算出算法提取样本集中特征最相似数据的分类标签 算法小解 如上图,已知六部电影,他们分别有自己的数据与标原创 2018-04-12 13:59:21 · 818 阅读 · 0 评论 -
3、k-近邻之识别手写算法
需求分析 我们使用k-近邻分类器来构造手写识别系统,下面是要识别的图像格式,尽管采用文本格式存储图像不能有效的利用内存空间,但是为了方便,我们还是将图像转换为文本格式。 以下图片肉眼观察大概是3准备数据本系列所有的代码和试验数据都可以在这里找到。代码详解from numpy import * import operator from os import listdir import time d原创 2018-04-12 16:47:01 · 186 阅读 · 0 评论 -
4、番外(何为信息熵)
本文转自知乎 问题名称 信息熵是什么? 作者:知乎用户 链接:https://www.zhihu.com/question/22178202/answer/49929786 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。让我们说人话!好的数学概念都应该是通俗易懂的。信息熵,信息熵,怎么看怎么觉得这个“熵”字不顺眼,那就先不看。我们起码知道这个概念跟信息有关系转载 2018-04-13 10:45:23 · 175 阅读 · 0 评论