![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉
秃然变强了
这个作者很懒,什么都没留下…
展开
-
基于BERT的多模态应用:图像,视频如何通过BERT处理
基于BERT的多模态应用:图像,视频如何通过BERT处理 本次分享的是结合了预训练的语言模型BERT和视觉方面的结合。 1. VideoBERT: A Joint Model for Video and Language Representation Learning 视频+文本的训练方法 通过automatic speech recognition (ASR)模块和vector quantization(VQ)模块,加上BERT形成整个模型。其中ASR模块是用来识别语音的神经网络模块,用来将视频中的语音翻原创 2020-06-03 22:16:51 · 4067 阅读 · 0 评论 -
图像数据增强读书笔记
A Survey on Image Data Augmentation for deep learning Ref: 1. A survey on Image Data Augmentation for Deep Learning 2. Generative Adversarial Network in Medical Imaging- A Review 1. 目的是解决过拟合问题 常用方法有: Dropout Batch normalization 等正则化方法 Transfer learning, p原创 2020-06-02 21:52:37 · 1745 阅读 · 0 评论