Taylorandy-CSDN博客

原创 UNITER多模态预训练模型原理加代码解读

UNITER多模态预训练模型原理1. 数据过去的5年中，Vision+NLP的研究者所使用的主要数据集如下展示：本文中所使用到的4种数据集如下图所示,Conceptual Captions和SBU Captions数据集是免费的，但是不是太clean：2. 算法2.1 整体结构这里采用的是two-stage training pipeline训练流程。在一些大量的，含有噪声但是比较cheap的数据上，我们设计一些预训练任务，但是这些预训练任务需要被小心的design，因为

2021-07-12 23:47:27 4270 3

原创 Transformer最详细的原理加代码解读

Transformer原理1. motivation 为了解决seq2seq的问题，之前一般都是使用RNN模型进行求解。RNN的一大劣势就是无法进行并行化计算，比如要想输出b4b^4b4就必须要先获得a1a^1a1到a4{a^4}a4才行。而接下来就有学者想采把CNN用来取代RNN，每个小三角形都是一个filter，但是问题是如下图所示每个小三角仅能考虑到很少的一部分输入，但是我们可以通过叠多层的CNN，则上层的filter就可以考虑到比较多的语句，如下所示蓝色的filter可以看到b1b^1b1到

2021-07-12 23:38:19 1152

原创 BERT原理加代码解读

BERT原理 BERT是google在2018年提出的一种全新的预训练语言模型， BERT的预训练是同时考虑左边和右边上下文的双向表示。将预训练好的BERT表示应用到各个任务时只需要微调最后一层就能达到最佳效果。主要贡献可以归纳以下三点： 1、我们证明了预训练双向语言模型对于语言表示的重要性，不向之前的尝试都是单向的语言模型，BERT使用遮盖（masked）语言模型解决双向表示问题。 2、我们证明了预训练的表示可以取代大量的任务特定的特征工程结构。BERT是第一个基于微调的表示

2021-07-12 23:32:54 1104

原创 kaleido-BERT原理

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar

2021-07-12 23:18:59 606

Taylorandy的博客

原创 UNITER多模态预训练模型原理加代码解读

原创 Transformer最详细的原理加代码解读

原创 BERT原理加代码解读

原创 kaleido-BERT原理

原创一段程序读懂位运算

原创两种hashtable的c++实现

转载牛顿法和拟牛顿法

原创梯度下降法及matlab代码详解实现

原创 C++灵魂指针详解

原创学习侯捷c++面向对象高级开发时培养大气的编程习惯几个注意事项（一）

空空如也

空空如也