深度学习
文章平均质量分 77
cheetah023
这个作者很懒,什么都没留下…
展开
-
lmdb高效存储图片数据
最近在做预训练的时候,需要从视频中提取图片,然后保存在lmdb数据库中。但是直接储存图片数据会占用很大的内存,所以存储的时候,需要先将图片编码压缩之后,再存储到lmdb数据库;读取的时候,需要读取出来之后再解压缩。参考:Write jpeg file directly to lmdb [closed] - 码农岛可以将文章内容翻译成中文,广告屏蔽插件可能会导致该功能失效(如失效,请关闭广告屏蔽插件后再试):问题:Imanagedtowritenumpyarraystolmdb,howewersolu原创 2022-03-01 12:25:39 · 2244 阅读 · 0 评论 -
多模态融合 fusion 的各种操作
文章转载:作者丨小奚每天都要学习@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/152234745Zhang, C., Yang, Z., He, X., \& Deng, L. (2020). Multimodal intelligence: Representation learning, information fusion, and applications.IEEE Journal of Selected Topics in Signal Pro转载 2021-08-30 20:13:18 · 3997 阅读 · 0 评论 -
Self-supervised Pre-training and Contrastive Representation Learning for Multiple-choice Video QA
AAAI 2021AbstractIn this paper, we propose novel training schemes for multiple-choice video question answering with a self-supervised pre-training stage and a supervised contrastive learning in the main stage as an auxiliary learn- ing.1. In the self原创 2020-12-21 11:29:49 · 499 阅读 · 0 评论 -
ShakeDrop正则化
论文地址:https://arxiv.org/abs/1802.02375ShakeDrop简介ShakeDrop用于缓解深度神经网络过拟合的问题,受到Shake-Shake方法启发。Shake-Shake方法有两个问题:1、只适用于ResNeXt网络, 2、Shake-Shake有效性的原理还未鉴定ShakeDrop可以适用于ResNet, Wide ResNet, PyramidNet另外由于有效的正则化往往造成训练不稳定的问题,文中还提供了一种新的稳定机制用于难以训练的网络.原创 2020-10-10 15:47:27 · 1288 阅读 · 1 评论