- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 补充:动态时间规整(DTW)算法
整理自:https://zhuanlan.zhihu.com/p/43247215DTW(dynamic time warping) 最初用于识别语音的相似性。我们用数字表示音调高低,例如某个单词发音的音调为1-3-2-4。现在有两个人说这个单词,一个人在前半部分拖长,其发音为1-1-3-3-2-4;另一个人在后半部分拖长,其发音为1-3-2-2-4-4。现在要计算1-1-3-3-2-4和1-3-2-2-4-4两个序列的距离(距离越小,相似度越高)。因为两个序列代表同一个单词,我们希望算出.
2021-03-26 21:01:34 196
原创 整理:TripletMarginLoss、nn.MarginRankingLoss
在pytorch中,提供了两个损失函数,都与triplet loss相关。但是使用的方式不一样。一、TripletMarginLoss这个就是最正宗的Triplet Loss的实现。它的输入是anchor, positive, negative三个B*C的张量,输出triplet loss的值。定义为:criterion = torch.nn.TripletMarginLoss(margin=1.0, p=2.0, eps=1e-06, swap=False, size_averag.
2021-03-24 17:00:43 8267 4
原创 补充:使用矩阵运算计算两组特征向量相互之间的距离
一、题目假设集合A有m个向量,集合B有n个向量。所有向量的维度都是d维。如何求这m个向量与这n个向量的距离(共m*n个)?二、分析一般,我们会想到使用两重循环的方式来求。for i in range(m): for j in range(n): dist[i][j] = ...但是比较耗时。三、方法我们可以使用矩阵运算来解决。表示成矩阵形式为:P(m*d矩阵)、C(n*d矩阵)。结果dist应该是m*n的矩阵。首先,看...
2021-03-23 15:06:49 1147
原创 实验2:FusionNet的实现
一、网络结构二、一步一步实现FusionNet(1)输入图像为640*640,3通道。经过一个卷积层,代码为: self.conv11 = nn.Sequential( nn.Conv2d(3, 64, kernel_size=3, stride=1, padding=1), #输入通道为3,输出通道为64。padding=1,输出尺寸不变。还是640*640. nn.BatchNorm2d(64), .
2021-03-18 21:47:58 911 1
隐马模型解决词性标注问题
2018-07-28
使用CRF++工具进行人名识别
2018-07-12
《矩阵论 第三版》程云鹏(竖着排版版的格式)+配套答案
2018-06-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人