机器学习
崚峰
这个作者很懒,什么都没留下…
展开
-
Python与机器学习(二)
Python与机器学习(二)无监督学习无监督学习 概念:利用无标签的数据学习数据的分布或数据与数据之间的关系被称为无监督学习。有监督学习和无监督学习的最大区别:数据是否有标签无监督学习最常应用的场景:聚类和降维聚类: 就是根据数据的”相似性”将数据分为多类的过程。sklearn库提供的常用聚类算法函数包含在sklearn.cluster这个模块中,如:K-Means,近邻传播算法,DB原创 2017-10-28 09:16:40 · 405 阅读 · 0 评论 -
每天30行代码——Logisstic回归梯度上升算法
from numpy import *def loadDataSet(): dataMat=[];labelMat=[] fr=open('testSet.txt') for line in fr.readlines(): lineArr=line.strip().split() dataMat.append([1.0,float(lineA原创 2017-11-24 22:21:15 · 436 阅读 · 0 评论 -
机器学习(三)
欠拟合和过拟合的概念上节回顾及本节大纲第二讲讲的是线性回归,本节要讲的称之为局部加权回归。中间有一个对线性回归的理解第一个分类算法:logistic回归(线性是指未知变量的指数为1)线性梯度下降和线性最小二乘本质上是一致的,最小二乘是代数形式,而梯度下降是方程形式(个人理解)本节内容概念欠拟合:数据中的某些非常明显的模式没有被拟合出来过拟合:算法拟合出的结果仅仅反映了所给的数据的特质原创 2017-11-13 22:26:26 · 389 阅读 · 0 评论 -
机器学习(二)
监督学习应用——梯度下降(和线性回归是什么关系?)自动驾驶可以说的一个监督学习的例子,因为人类司机提供的正确驾驶方向就是数据集中的正确答案梯度下降算法——第一个监督学习算法思想: 构造出误差表示函数之后,向误差下降最快的方向走性质: 一定会结束起点不同,最后结束时得到的局部最优值可能不同。即梯度下降的结果有时会依赖于参数的初始值当接近局部最小值时,步子会越来越小(因为每次下降都会乘以原创 2017-11-13 22:25:59 · 267 阅读 · 0 评论 -
机器学习(一)
机器学习的动机与应用数据挖掘与机器学习数据挖掘:英文为data mining,也就是从数据中挖掘出有用的信息。机器学习:因为是machine learning,是计算机科学和统计学的交叉学科,基本目标是学习一个X到Y的函数,来做分类或者回归的工作。联系: 机器学习经常和数据挖掘合在一起讲是因为好多数据挖掘的工作是通过机器学习提供的算法工具实现的。数据挖掘是做什么,机器学习是怎么做。数据挖掘原创 2017-11-13 22:25:39 · 1018 阅读 · 0 评论 -
分类与聚类的区别
分类和聚类的区别: Classification (分类),对于一个classifier,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个 classifier 会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做supervised learning (监督学习)Clustering (聚类),简单地说就是把相似的东西分到一组原创 2017-11-13 22:24:18 · 2692 阅读 · 0 评论 -
机器学习常见算法
分类算法K近邻算法通俗理解: 有那么一堆你已经知道分类的数据,然后当一个新数据进入的时候,就开始跟训练数据里的每个点求距离,然后挑离这个训练 数据最近的K个点看看这几个点属于什么类型,然后用少数服从多数的原则,给新数据归类。缺点: 计算量太大对于样本分类不均衡问题会产生误判贝叶斯方法地位:贝叶斯方法是机器学习的核心方法之一贝叶斯公式:就是概率论中学到的那个没有深刻理解的公式 P(B原创 2017-11-13 22:16:00 · 241 阅读 · 0 评论 -
Python与机器学习(三)
监督学习概念: 利用一组带标签的数据,学习从输入到输出的映射,然后将这种映射关系应用到未知数据上,达到分类或回归的目的。分类:当输出是离散的,学习任务为分类任务回归:当输出是连续的,学习任务为回归任务分类学习 输入:一组有标签的训练数据,标签表明了这些数据的所属类别输出:分类模型根据这些训练数据,训练自己的模型参数,学习出一个适合这组数据的分类器,当有新数据需要进行类别判断,就可以将这原创 2017-10-29 21:12:22 · 310 阅读 · 0 评论 -
Python与机器学习(一)
Python与机器学习评价 机器学习是当下最流行的人工智能技术方法Python是当下最流行的科学计算语言机器学习的目标 机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习,改善具体算法的性能。主要涉及的学科 概率论、统计学、算法复杂理论机器学习的分类: 监督学习无监督学习强化学习半监督学习深度学习Scikit-learn的概述 一组简单有效的工具集原创 2017-10-26 20:56:40 · 406 阅读 · 0 评论 -
每天30行代码——随机梯度上升算法
梯度上升算法每次更新回归系数时都要遍历整个数据集,在样本数较少时还可以,当样本数目太多时复杂度太高,所以产生了随机梯度上升算法,每次仅用一个样本点来更新回归系数。 def stocGradAscent0(dataMatrix,classLabels): m,n=shape(dataMatrix) alpha=0.01 weights=ones(n) for i原创 2017-11-26 22:27:00 · 1010 阅读 · 0 评论