机器学习
有理叔
软件爱好广泛,对代码质量和结构有深刻的理解,代码洁癖,掌握Linux C语言开发,Android应用开发,Python开发,iOS开发等,最近沉迷Golang不可自拔
展开
-
k-近邻算法进行分类
最近学习机器学习,教材主要是周志华老师的《机器学习》和Peter Harrington的《机器学习实战》,周老师的书比较偏向于算法的讲解和推导,理论性很强,而《机器学习实战》更偏向机器学习算法的实际使用,还有Python代码的实现,更加直观。两本书配合起来,理论联系实际,可以学到不少东西。今天先来看看比较简单的k-近邻算法,k-近邻算法属于监督学习方法,主要用于分类,它是懒惰学原创 2018-02-03 15:49:22 · 1896 阅读 · 0 评论 -
机器学习基本概念总结
机器学习主要通过计算的手段从数据中提取出相应的模型,也就是说,机器学习的输入是数据,经由学习算法,输出相应的模型,以后我们就可以基于这个模型解决实际问题了。在机器学习中,输入数据被称为数据集,数据集被分为训练集和测试集。训练集用来通过学习算法训练模型,而测试集则用来评估我们的模型性能。数据集中包含一条条样本,样本则是由属性或特征构成的。例如描述人的数据,其中包含特征身高(c原创 2018-01-27 19:07:19 · 412 阅读 · 0 评论 -
基于sklearn实现kNN
春节前的一篇文章给大家介绍了kNN算法,算法有助于大家理解运行机制,方便对参数调优。成熟的算法,自然已经有现成的模块可以使用。scikit-learn包是Python的一个机器学习组件,其中实现了kNN,支持向量机,k均值聚类等一系列机器学习算法。安装scikit-learn包需要下面三个命令:pip/pip3 install numpypip/pip3 install scipypip/pip3...原创 2018-03-04 09:57:47 · 8842 阅读 · 5 评论 -
Logistic回归算法
今天的文章看一下《机器学习实战》中提到的Logistic回归算法。虽然是名称是回归,但Logistic算法并不用来进行拟合,主要用来处理分类问题。对于二分类问题,我们假设正类的标签值为1,反类的标签值为0,我们可以寻找一个函数,在给定输入(样本特征值)下,可以输出0或者1。最好的函数应该是单位阶跃函数,如图所示:但是,单位阶跃函数存在一个问题,在0处,函数不连续,这会给我们的后续的数学运算带来很多...原创 2018-03-24 10:54:59 · 508 阅读 · 0 评论 -
sklearn中的Logistic回归
上一篇文章,我们简单介绍了Logistic回归算法进行二分类的原理,并通过代码了解了Logistic回归算法的实现。Logistic回归算法理论上只可以处理二分类问题,实际应用中,如果需要处理多分类问题,有两种改进方式。这里推荐一篇博文.sklearn中本身提供了Logistic回归算法,而且可以处理多分类问题,今天的文章真的很简单。from sklearn import datasetsimp...原创 2018-03-30 09:39:28 · 1687 阅读 · 0 评论 -
线性回归算法原理及实现
我们之前介绍了几种机器学习算法,这些机器学习算法都是用来进行分类的。今天换换口味,我们来了解一下如何进行回归,回归是基于已有的数据对新的数据进行预测,比如预测产品销量。我们来看看最简单的线性回归,基于标准的线性回归,可以扩展出更多的线性回归算法,比如基于核函数的局部加权线性回归,lasso等。希望了解的可以查阅相关的资料。下面来看看最基本的线性回归的原理。根据线性代数,我们可以定义线性方程组Xw=...原创 2018-04-05 16:32:15 · 27633 阅读 · 0 评论 -
k-means聚类算法
之前介绍的几种算法,都是监督学习算法,我们需要对数据进行预处理,也就是在使用数据前,需要对数据集的样本数据进行标记。今天我们看一种无监督学习算法——k-means。k-means算法用来实现聚类,什么是聚类?打一个比方,我们在袋子中放着各种水果,我们事先并不知道有哪几种,通过一些算法,我们可以借助于特性将水果聚集为几个类别,然后我们再去看这几个类别分别代表了什么水果。k-means算法的思想非常简...原创 2018-04-14 09:54:58 · 2338 阅读 · 0 评论 -
在数据集CIFAR10上使用Keras构建卷积神经网络
Keras是一套构建深度学习模型的高级API,使用Keras可以使构建深度学习模型和摆乐高积木类似,使用不同的组件构建模型即可,不需要复杂的深度学习网络构造。CIFAR10数据集共有60000张彩色图像,这些图像是32*32,分为10个类,每类6000张图。内容如下对于多分类图像识别问题,我们最常采用的方法就是卷积神经网络,重点在于构造合适的网络结构,使得训练精度尽可能高。我们先给出代...原创 2019-06-23 08:52:34 · 2404 阅读 · 2 评论