机器学习
文章平均质量分 92
zlinxi
学习,永无止境!
展开
-
深度学习之人工神经网络学习
人工神经网络就是把这样的人工神经元互联成一个网络:一个神经元的输出作为另一个神经元的输入。神经网络可以有多种多样的拓扑结构。其中最简单的就是「多层全连接前向神经网络」。它的输入连接到网络第一层的每个神经元。前一层的每个神经元的输出连接到下一层每个神经元的输入。最后一层神经元的输出就是整个神经网络的输出。如下图,是一个三层神经网络。它接受 10 个输入,也就是一个 10 元向量。第一层和第二层各有 ...转载 2018-10-30 09:57:35 · 993 阅读 · 0 评论 -
机器学习十大算法之Apriori
一、概述Apriori算法是常用的挖掘数据关联规则的算法,该算法用来找出数据值中频繁出现的数据集合,通过找出这些集合的模式来帮助我们做一些决策。二、相关问题1、首先通过一个例子来讲解Apriori算法。购物篮分析:引发性例子Question:哪组商品顾客可能会在一次购物时同时购买?关联分析Solutions: 1):经常同时购买的商品可以摆近一点,以便进一步刺激这...转载 2018-11-29 21:12:13 · 564 阅读 · 0 评论 -
机器学习十大算法之贝叶斯算法
一、概述贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。贝叶斯分类器的分类原理是通过先验概率,利用贝叶斯公式计算出后验概率,选择最大后验概率所对应的分类结果。二、算法1、原理首先,我们需要了解条件概率,基本公式为:其中P(A|B)表示在B发生的情况下A发生的可能性。贝叶斯定理是关于随机事件A和B的条件概率,有时候我们很容易得出P(A|...转载 2018-11-29 15:59:39 · 642 阅读 · 0 评论 -
机器学习十大算法之k-means
一、概述k-means算法是一种聚类算法,聚类是指根据相似性原则,将具有较高相似度的数据对象划分在同一类簇,将具有较高相异度的数据对象划分至不同类簇。聚类是一种无监督的过程,即待处理对象未经过任何先验知识。在k-means算法中,k是指类簇的个数,means是指簇内数据对象的均值。k-means算法是一种基于划分的聚类算法,以距离作为数据对象间相似性度量的标准,即数据对象间的距离越小,则它们的...转载 2018-11-29 11:01:22 · 379 阅读 · 0 评论 -
机器学习十大算法之EM
一、概述EM算法是一种启发式的迭代方法,用于含有隐含变量Z的概率模型参数的最大似然/最大后验估计。由于含有隐变量不能直接使用MLE、MAP,因此用隐变量的期望来代替它,再通过最大化对数边际似然(marginal likelihood)来逐步逼近原函数的极大值,EM的优点是简单、稳定,但容易陷入局部最优解。EM算法是一种非监督的学习算法,它的输入数据事先不需要进行标注。二、相关概念1、极...转载 2018-11-24 20:32:22 · 338 阅读 · 0 评论 -
机器学习十大算法之KNN
一、概述KNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。二、算法如下图的例子,在图中一共有两类,蓝色和红...转载 2018-11-20 22:28:07 · 157 阅读 · 0 评论 -
机器学习十大算法之决策树
一、算法原理决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。决策树是一种十分常用的分类方法。它是一种监管学习,...转载 2018-11-05 15:22:58 · 549 阅读 · 0 评论 -
机器学习十大算法之CART
一、概述CART(Classification And Regression Tree)即分类回归树算法,它是决策树的一种实现,通常决策树主要有三种实现,分别是ID3算法,CART算法和C4.5算法。CART算法是一种二分递归分割技术,把当前样本划分为两个子样本,使得生成的每个非叶子结点都有两个分支,因此CART算法生成的决策树是结构简洁的二叉树。由于CART算法构成的是一个二叉树,它在每一...转载 2018-11-12 11:40:55 · 4865 阅读 · 0 评论 -
深度学习之3D卷积神经网络
一、概述3D CNN主要运用在视频分类、动作识别等领域,它是在2D CNN的基础上改变而来。由于2D CNN不能很好的捕获时序上的信息,因此我们采用3D CNN,这样就能将视频中时序信息进行很好的利用。首先我们介绍一下2D CNN与3D CNN的区别。如图1所示,a)和b)分别为2D卷积用于单通道图像和多通道图像的情况(此处多通道图像可以指同一张图片的3个颜色通道,也指多张堆叠在一起的图片,即...原创 2018-11-04 10:34:11 · 44925 阅读 · 12 评论 -
深度学习之生成对抗网络
一、基本原理生成对抗网络有一个生成器(Generator,简称G)生成数据和一个鉴别器(Discriminator,简称D)鉴别数据是否与真实数据相似。GAN是半监督学习方式训练的模型,基于神经网络,经常被用在图像处理和半监督学习领域。生成器作用D:生成和真实数据几乎没有差距的数据鉴别器的作用G:尽最大努力区分生成器生成的数据和真实数据训练一个生成器(Generator,简称G)...转载 2018-11-03 10:05:35 · 2637 阅读 · 1 评论 -
谱聚类算法简单理解
一、算法思想谱聚类是基于图论的知识所演化出的算法,在聚类中广泛使用。主要思想是将所有的数据看成空间中的点,这些点之间可以用边连接起来,距离较远的两点之间边的权重值较低,距离较近的两点间边的权重值较高,然后通过对所有数据点组成的图进行切图,让切图后不同子图间边的权重之和尽可能低,子图内边的权重之和尽可能高,从而达到聚类的目的。 ...转载 2018-11-02 09:41:22 · 12215 阅读 · 0 评论 -
深度学习之卷积神经网络
一、使用卷积神经网络的原因 我们知道,图像是由一个个像素点构成,每个像素点有三个通道,分别代表RGB颜色,那么,如果一个图像的尺寸是(28,28,1),即代表这个图像的是一个长宽均为28,channel为1的图像(channel也叫depth,此处1代表灰色图像)。如果使用全连接的网络结构,即,网络中的神经与与相邻层上的每个神经元均连接,那就意味着我们的网络有28 * 28 =784个神经元,...转载 2018-10-30 16:13:22 · 1141 阅读 · 0 评论 -
机器学习十大算法之SVM
一、概述支持向量机(SVM)是一种二类分类模型,属于监督学习的方法,广泛用于统计分类以及回归分析。它是在特征空间上的间隔最大的线性分类器,支持向量机还包括核技巧,从而使该模型可以使用于非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题。二、算法原理1、线性分类器这里我们需要了解一个很重要的分类标准,Logist...转载 2018-11-27 20:25:47 · 560 阅读 · 0 评论