![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
杂集
文章平均质量分 65
hei_hei_hei_
这个作者很懒,什么都没留下…
展开
-
统计学三种相关系数【pearson、spearman、kendall】
1. pearsonpearson系数的取值范围为[−1.0,1.0][-1.0,1.0][−1.0,1.0]之间,接近0表示无相关性,接近1或-1表示强相关皮尔森相关性系数对数据的要求较高:(1)实验数据通常假设是成对地来自正态分布的总体。因为在求得皮尔森相关性系数之后,通常会用t检验之类的方法来进行皮尔森相关性系数检验,而t检验是基于数据呈正太分布的假设。(2)实验数据之间的差距不能太大,或者说皮尔森相关性系数受异常值影响较大。ps:分母部分是两个变量的标准差之积,不能为0。因此任何一个原创 2022-05-16 10:56:57 · 5666 阅读 · 0 评论 -
【GRU】线性门控单元
主要思想主要是为了解决RNN无法并行的缺点,利用卷积和门控机制并行处理时序数据的一种技术。其优点在于在处理时序数据时保留了时序位置信息,并且能够并行处理数据加快了运算速度。在语言模型上相比RNN更具有竞争力,使用简单的线性门控单元堆叠卷积层从而在或得上下文语义特征的同时可以并行化处理数据计算公式整体结构如下输入层:输入的embedding E卷积:这里有点类似一维卷积,在每个位置指定窗口大小做卷积操作。分别输入到两个卷积层得到A和B门控:将B经过sigmod激活,然后与A进行element-原创 2022-05-12 20:41:31 · 1111 阅读 · 0 评论 -
双线性池化【BiLinear Pooling】
1. 简介bilinear pooling主要用于特征融合,对于从同一个样本中提取出来的特征x和y,通过bilinear pooling操作可以得到x和y融合后的特征(本质是向量相乘)ps:如果x和y来自两个特征提取器,则被称为多磨双线性池化(MBP);若x=y,则被称为同源双线性池化(HBP)或二阶池化(Second-order Pooling)2. 计算过程对于图像III在位置lll上的两个特征向量fA(l,I)∈RT×Mf_A(l,I)∈R^{T×M}fA(l,I)∈RT×M和fB(l,I)原创 2022-05-12 16:09:48 · 1098 阅读 · 0 评论 -
集束搜索【beam search】
说明:用于在搜索中选择较优的结果,相对于暴力搜索减少了存储和计算资源。常被用于文本生成任务中。主要思想:以se2seq为例(一般用于测试,因为在训练的时候已经知道最优解),在decoder部分,假设每一步会生成s个数值分别表示属于词典中各个单词的概率。在第t步选择s中的top-k个(beam size=k),其对应的k个单词作为t+1步的输入(分别输入),在第t+1步,得到k∗sk*sk∗s个概率值,从中选择top-k作为t+2步的输入,如此循环往复直到出现结束符。下面这个例子将beam search在原创 2022-05-12 11:57:31 · 313 阅读 · 0 评论