guozhihao12345-CSDN博客

转载 CTC算法详解

前言CTC全称Connectionist temporal classification，是一种常用在语音识别、文本识别等领域的算法，用来解决输入和输出序列长度不一、无法对齐的问题。在CRNN中，它实际上就是模型对应的损失函数。CRNN的模型结构如下图所示：其中的Feature sequence即为下文所说的x输入变量，Predicted sequence即为下文所说的y输出变量，此时x和y的长度是不一样的，所以CTC主要做的工作就是x和y的对齐。再进行进一步叙述前，这里需要做几点说明。不管是在语

2020-10-30 19:14:27 4115

转载一文看懂 Attention（本质原理+3大优点+5大类型）

Attention 正在被越来越广泛的得到应用。尤其是 BERT 火爆了之后。 Attention 到底有什么特别之处？他的原理和本质是什么？Attention都有哪些类型？本文将详细讲解Attention的方方面面。 Attention 的本质是什么 Attention（注意力）机制如果浅层的理解，跟他的名字非常匹配。他的核心逻辑就是「从关注全部到关注重点」。 Attention的本质 Attention 机制很像人类看图片的逻辑，当我们...

2020-10-24 14:51:10 3863 1

转载序列模型简介——RNN, Bidirectional RNN, LSTM, GRU

既然我们已经有了前馈网络和CNN，为什么我们还需要序列模型呢？这些模型的问题在于，当给定一系列的数据时，它们表现的性能很差。序列数据的一个例子是音频的剪辑，其中包含一系列的人说过的话。另一个例子是英文句子，它包含一系列的单词。前馈网络和CNN采用一个固定长度作为输入，但是，当你看这些句子的时候，并非所有的句子都有相同的长度。你可以通过将所有的输入填充到一个固定的长度来解决这个问题。然而，它们的表现仍然比RNN要差，因为这些传统模型不了解给定输入的上下文环境。这就是序列模型和前馈模型的主要区别所在。对于一个句

2020-10-24 11:26:46 654

guozhihao12345的博客

转载 CTC算法详解

转载一文看懂 Attention（本质原理+3大优点+5大类型）

转载序列模型简介——RNN, Bidirectional RNN, LSTM, GRU

转载 CSDN怎么转载别人的博客

转载图解Transformer（完整版）

原创 Python import 失败

转载 caffe基础介绍

转载 ubuntu14.04下安装matlab2015b

原创 caffe下的finetune训练

转载如何在Caffe中配置每一个层的结构

转载 caffe源码简单解析——Layer层

转载 C++模板

原创 Ubuntu 14.04安装Caffe

原创 opencv视频格式转换出现色彩异常的处理

原创 ffmpeg到opencv的格式转换

原创 Camshift的优点与缺点

原创 ubuntu下简单安装opencv的方法

原创 ++i与i++的区别

原创家庭物体识别调研

原创 C++指针（一）

空空如也

空空如也