润°-CSDN博客

原创残差网络

残差网络残差、误差概念统计学里残差的概念是：模型预测值与实验观测值之差（只针对于回归模型）。这里明确一点就是，模型预测值就是通过数学方法构建的模型本身。可以想象一下，线性回归模型，就是通过数学方法拟合出来的一条直线，这条直线就是模型预测值！那么实验观测值是什么呢？观测值就是数据！仍然以线性回归模型为例，观测值就是分布在直线周围的那些数据点。计算残差时，模型已经确定，是不发生变化的，而数据是根据实验次数的不同要发生变化的，即每次实验取不同的数据。误差的概念比较绕，我总结如下（不一定准确，只是我个人通

2021-05-17 17:04:22 461

原创假设检验的两类错误

弃真错误也叫第I类错误或α错误：它是指原假设实际上是真的，但通过样本估计总体后，拒绝了原假设。明显这是错误的，我们拒绝了真实的原假设，所以叫弃真错误，这个错误的概率我们记为α。这个值也是显著性水平，在假设检验之前我们会规定这个概率的大小。取伪错误也叫第II类错误或β错误：它是指原假设实际上假的，但通过样本估计总体后，接受了原假设。明显者是错误的，我们接受的原假设实际上是假的，所以叫取伪错误，这个错误的概率我们记为β。我们把第一类错误出现的概率用α表示。这个α，就是Significance Level

2020-08-04 20:57:36 4877

原创 Numpy的广播机制（broadcast）

原理：如果两个数组的后缘维度（从末尾开始算起的维度）的轴长度相符或其中一方的长度为1，则认为它们是广播兼容的，广播会在缺失维度或者轴长度为1的维度上进行。举例说明：import numpy as nparr = np.random.randn(4, 3) # -> shape=(4, 3)首先通过计算说明什么是缺失维度demeaned = arr - arr.mean(axis=0) # -> shape=(4, 3) - shape=(3, ) = shape=(4, 3)通

2020-07-05 13:28:49 349

原创 Tensorflow的负采样函数Sampled softmax loss学习笔记

最近阅读了YouTube的推荐系统论文，在代码实现中用到的负采样方法我比较疑惑，于是查了大量资料，总算能够读懂关于负采样的一些皮毛。本文主要针对tf.nn.sampled_softmax_loss这个函数进行讲解，并引申一些数学意义，偏实用性。类别和标签在阅读代码的过程中发现一个问题，就是代码作者先是对样本打y，打y的依据是即user最后时刻观看的视频是否正确，那么这样的话，很明显没有负样本，而且最终的损失函数用的是tf.nn.sampled_softmax_loss，很明显是多分类，那么打二分类标签

2020-07-04 18:47:41 2521 1