- 博客(6)
- 资源 (5)
- 收藏
- 关注
原创 机器学习面试问题集(2018-3-13更新)
http://blog.csdn.net/u011239443/article/details/763602941 基础概念1.1 熵、联合熵、条件熵、交叉熵与相对熵的意义?1.2 归一化方法?1、线性函数归一化(Min-Max scaling) 线性函数将原始数据线性化的方法转换到[0 1]的范围,归一化公式如下: 2、0均值标准化(Z-score sta...
2017-07-30 11:43:27 22617 1
原创 深入理解Spark ML:多项式朴素贝叶斯原理与源码分析
http://blog.csdn.net/u011239443/article/details/76176743朴素贝叶斯的基本原理与简单的python与scala的实现可以参阅:http://blog.csdn.net/u011239443/article/details/68061124如果一个给定的类和特征值在训练集中没有一起出现过,那么基于频率的估计下该概率将为0。这将是一个问题。因为与其他概率相乘时将会把其他概率的信息统统去除。所以常常要求要对每个小类样本的概率估计进行修正,以保证不会出现有为0的
2017-07-27 12:27:54 4964 1
原创 《neural network and deep learning》题解——ch03 过度拟合&规范化&权重初始化
问题一 正如上面讨论的那样,一种扩展 MNIST 训练数据的方式是用一些小的旋转。如果我们允许过大的旋转,则会出现什么状况呢?如果我们允许过大的旋转,会使得模型不能很好的学习到数字的特征,甚至学习到错误的特征。
2017-07-16 16:41:10 1199
原创 《neural network and deep learning》题解——ch03 交叉熵代价函数
这在分类问题一般是可行的,但是对其他的问题(如回归问题)y 可以取 0 和 1 之间的中间值的。我们已经深入讨论了使用二次代价函数的网络中在输出神经元饱和时候学习缓慢的问题,另一个可能会影响学习的因素就是在方程 (61) 中的 x j 项。但是如果我们使用不同的 c得到不同的函数,其本质上和原来的柔性最大值函数是很相似的。正如通常的柔性最大值函数。是输入中的最大值,则$ a^L_j$ 的极限值为1,否则$ a^L_j$ 的极限值为0。用上一章的定义符号,证明对二次代价函数,关于输出层的权重的偏导数为。
2017-07-13 19:49:11 2630 2
原创 《neural network and deep learning》题解——ch02 Network源码分析
完整代码:https://github.com/xiaoyesoso/neural-networks-and-deep-learning/blob/master/src/network.py初始化 # sizes 是每层节点数的数组 def __init__(self, sizes): self.num_layers = len(sizes) self.
2017-07-12 12:24:13 1630
原创 《neural network and deep learning》题解——ch02 反向传播
另一种反向传播方程的表示方式: 我已经给出了使用 Hadamard 乘积的反向传播的公式(尤其是 (BP1) 和 (BP2))。$\large \color{blue}{则: (BP1):δ ^L = ∇ _a C ⊙ σ ′ (z ^L ) = \begin{pmatrix} c1σ1\ c2σ2\…线性神经元上的反向传播假设我们将非线性神经元的 σ 函数替换为 σ(z) = z。σ ′ (z_j^L )$,其他的元素均是 0。证明方程 (BP3) 和 (BP4)。结合(1)和(2)证明。
2017-07-09 13:58:41 2178 2
SMP2020微博情绪分类技术评测数据集
2022-12-29
jblas-1.2.4-SNAPSHOT
2016-06-26
Spark机器学习文本处理数据集
2016-06-20
Spark机器学习推荐模型数据集
2016-06-18
Spark机器学习回归模型数据集
2016-06-15
Spark机器学习分类模型的数据集
2016-06-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人