机器学习
文章平均质量分 59
believe0ne
这个作者很懒,什么都没留下…
展开
-
卷积神经网络-截自Deep Learning by Yann LeCun
卷积神经网络是为了处理多维数组提出的模型。这个多维数组可以指3通道的二维数组比如颜色图像。除此之外,这种类型的数据还有许多:1维的信号或序列数组(比如文字)、二维的图像或音频频谱图以及三维的视频或立体图像。通过利用自然信号的特点,卷积神经网络的四个设计点在于局部连接、权值共享、池化以及多层结构(local connections, shared weights, pooling and the us翻译 2016-11-26 19:15:49 · 735 阅读 · 0 评论 -
[caffe] 使用笔记
snapshot 再训练命令 #!/usr/bin/env shcd ~/caffe./build/tools/caffe train \ --solver=examples/ResDN/ResDN_solver.prototxt \ --snapshot=examples/ResDN/Conv1-_iter_5500.solverstate通过设置snapshot参数,在已有的结果上继续原创 2016-12-11 21:14:38 · 228 阅读 · 0 评论 -
SVM分类器
支持向量机的目的是为了找到分类间隔最大的分割超平面。 分割超平面即距离所有样本最小距离的值最大的超平面。 一般是通过最大化几何间隔实现。 几何间隔: y(wx+b)||w||\frac{{y(wx + b)}}{{||w||}}由于通过按照一定的比例缩放,我们总可以另y(wx+1)y(wx+1)为1,从而最大化几何间隔就等价于求解1||w||\frac{1}{||w||}的最大值。将其转化为原创 2016-10-19 21:01:28 · 536 阅读 · 0 评论 -
贝叶斯分类器
贝叶斯定理是一个条件概率或边缘概率计算公式,已知事件X下事件Y的后验概率,P(Y|X)=P(X|Y)P(Y)P(X)P(Y|X)=\frac{P(X|Y)P(Y)}{P(X)}。这里,补充一点,虽然后验概率和似然概率都是条件概率,区别在于后验概率是相对事件而言的,而似然函数是对未知参数而言的。一般来说贝叶斯分类器是根据贝叶斯定理求出后验概率(经验风险)最大的一组输出y。 最大后验概率等价于0-1损原创 2016-10-05 21:22:05 · 330 阅读 · 0 评论 -
逻辑回归学习笔记
逻辑回归逻辑回归是一个二分类问题,在分类过程值中可以得到代分类样本所属类别的概率。对于输入x和输出预测结果y={0,1}y=\{0,1\},逻辑回归采用sigmoid函数,将实数域的x映射到[0,1][0,1]区间。sigmoid函数如下所示 h(θx)=11−e−θxh(\theta x)=\frac{1}{1-e^{-\theta x}} 则可以得到输入x属于正例和反例的概率,如下 P原创 2016-10-05 20:27:53 · 306 阅读 · 0 评论 -
统计学习基础知识
1、学习三要素:模型、策略、算法 模型:即所要学习问题的条件概率分布或决策函数,即想要解决什么样的问题以及对该问题的统计学抽象,加上一定的假设。 策略:学习最优模型的优化方法,一般有两种:经验风险最小化和结构风险最小化。这两个方法是可以同时使用的,一般来说,也都是同时使用的。 经验风险最小化,可以简单理解为对损失函数期望的最小化估计。期望风险就是泛化误差,即该模型对未知数据的预测能力。原创 2016-10-05 20:16:24 · 390 阅读 · 0 评论 -
Learning Deep Learning
深度学习的基本网络架构: 1、LeNet 结构设计: layer 1: 卷积层 6x6x5 layer 1.5: 下采样层 2x2 layer 2: 卷积层 5x5x16 layer 2.5: 下采样层 2x2 layer 3: 全连接层 120 layer 4: 全连接层 84 layer 5: soft-max 输出10个类别 之后的发展趋势就是在基本的网络结构的基础原创 2016-11-06 11:40:38 · 432 阅读 · 0 评论 -
支持向量机学习笔记
支持向量机支持向量机的目的是为了找到分类间隔最大的分割超平面。分割超平面即距离所有样本最小距离的值最大的超平面。一般是通过最大化几何间隔实现。几何间隔:其中,为由于通过按照一定的比例缩放,我们总可以另为1,从而最大化几何间隔就等价于求解的最大值。将其转化为求最小值的问题,可得目标函数:s.t其lagrange函数为原创 2016-06-28 21:54:24 · 327 阅读 · 0 评论 -
[转] Caffe 基础
Caffe的全称应该是Convolutional Architecture for Fast Feature Embedding,它是一个清晰、高效的深度学习框架,它是开源的,核心语言是C++,它支持命令行、python和Matlab接口,它既可以在CPU上运行也可以在GPU上运行。它的license是BSD 2-Clause。Deep Learning比较流行的一个原因,主要是因为它能够自主地从数转载 2016-12-08 20:43:44 · 388 阅读 · 0 评论