![](https://img-blog.csdnimg.cn/20190926170758659.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习
主要内容为主流机器学习原理,算法,以及实例
xiaotang_sama
这条街上最快乐的代码仔
展开
-
【机器学习00】【简介】
近期终于有时间开始写博客了,这是关于kaggle竞赛从入门基础到实际解决一个问题的专题原创 2019-09-26 17:41:57 · 184 阅读 · 0 评论 -
【机器学习】【无监督学习】【算法01-理论2】Apiori算法-关联规则获取
之前的章节分析了如何从原始数据集合中获取频繁项集,并且给出了代码演示,如需要请访问以下链接【机器学习】【无监督学习】【算法01-理论1】Apiori算法-筛选频繁集【机器学习】【无监督学习】【算法01-代码实现】Apiori算法-筛选频繁集接下来进行关联分析的第二个步骤讲解:关联规则获取1 理论解释在筛选频繁集的理论部分,我们已经提到关联分析其实总共就是两个步骤:频繁项集发现、关联规...原创 2020-04-02 22:14:39 · 560 阅读 · 0 评论 -
【机器学习】【无监督学习】【算法01-代码实现】Apiori算法-筛选频繁集
本节将会对于Apriori算法的频繁集筛选过程,进行代码的展示1 回顾上节提到,对于Apriori算法来说,其核心价值是在关联分析的两个过程,即筛选频繁项集、关联规则获取的过程中,使得过程更加简便。首先,回顾一下Apriori算法中使得计算过程变得简便的原理(Apriori原理):如果某个项集是频繁的,那么它的所有子集也是频繁的反之,如果一个项集是非频繁集,那么 它的所有超集也是非...原创 2020-03-31 18:10:43 · 905 阅读 · 0 评论 -
【机器学习】【无监督学习】【算法01-理论1】Apiori算法-筛选频繁集
Apriori算法Apriori算法是一种用于进行关联分析的算法,在Agrawal 等人提出的1993最初提出的动机是针对购物篮分析问题提出的,其目的是为了发现交易数据库中不同商品之间的联系规则。接着,有更多的研究人员加入了关联规则的发掘研究中来,今天先暂时介绍最经典的Apriori算法1.引入关联分析:关联分析指的是在大规模数据集和中寻找关系的任务。一般来说,数据集合中的关系分为两...原创 2020-03-30 16:50:02 · 655 阅读 · 0 评论 -
【机器学习】【监督学习】【算法01-实例03】K近邻(k-nearest neighbor)-手写识别
0 数据说明手写识别也是一个非常经典的应用实例。在本次应用当中,数据的格式如下:File name:‘_’为划分,前为标签,后为例子数。例如‘0_0’就是0的手写体的第一个实例。内容:文本内容为32×32 的1-0像素存储的点,如果使用img可视化,可以看到黑白的数字的效果。待会需要处理成1*1024矩阵的形式。1 数据处理这一步需要比较注意的点是:使用readline()方法...原创 2019-12-17 15:51:57 · 208 阅读 · 0 评论 -
【机器学习】【监督学习】【算法01-实例01】K近邻(k-nearest neighbor)-改进约会网站的配对效果
数据以及代码参考来源:<机器学习实战>0.必要的库from numpy import *from KNN import classify0 #这里存的是我写在KNN.py中的分类器代码import matplotlibimport matplotlib.pyplot as plt1.获得数据:从文本中读取数据注意:笔者在这里对此函数进行了修改,主要是添加了...原创 2019-12-16 21:10:55 · 200 阅读 · 0 评论 -
【机器学习】【监督学习】【算法01-代码实现】K近邻(k-nearest neighbor)实现细节
根据在《机器学习实战》这本书的代码和演示实例,给出KNN算法的实现细节,其中也包括一些数据分析中常用的用法的构建。1.KNN分类器构建#四个参数,分别是待判定的向量x,训练集,标签,k值def classify0(inX,dataSet,lables,k): # 计算dataSet第一维的长度,一般来说,这里计算的就是实例个数 #请注意,这里的0是数组中的用法,指的是0维,这...原创 2019-12-16 19:36:48 · 305 阅读 · 0 评论 -
【机器学习】【监督学习】【算法01—理论】K近邻(k-nearest neighbor)
从本节博客开始,我们直接进入具体的机器学习算法以及应用上,笔者暂时的想法是每一个算法都分成两个部分。第一个部分是算法原理,包括算法的描述,数学的内容。第二部分是一个应用的实例,来加深对于算法的理解。K-近邻算法KNN算法是由Cover和Hart在1968年提出,是一种简单而典型的机器学习的监督式学习算法。今天要整理的K-近邻算法是监督学习中最简单的一种,如果简单实现的话,我们只需要提...原创 2019-09-29 12:03:14 · 408 阅读 · 0 评论 -
【机器学习】【监督学习】【算法01-实例02】K近邻(k-nearest neighbor)-鸢尾花
鸢尾花的分类实例是一个非常经典的例子。我们首先从数据集的结构特点来开始。1.数据集的加载# 从sklearn.datasets 导入 iris数据加载器。from sklearn.datasets import load_iris# 使用加载器读取数据并且存入变量iris。iris = load_iris()# 查验数据规模。#如果想要在pycharm这类的编辑器里面显示,加上pri...原创 2019-09-29 18:06:41 · 537 阅读 · 0 评论