超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第3期《智源社区周刊:预训练模型》,从论文推荐、研究动态、热点讨论等几个维度推荐最近一周内发生在预训练模型领域值得关注的信息。
本期贡献者:亓宗帅 常政
论文推荐
随着预训练技术逐渐成熟,越来越多的研究转向预训练技术的现实应用。本期推荐五篇预训练相关论文,具体方向分别是Image Caption、语音识别、程序语言表示、多模态预训练数据集、预训练模型评估。
标题:VisualGPT: Data-efficient Image Captioning by Balancing Visual Input and Linguistic Knowledge from Pretraining(VisualGPT:在Image Captioning中用预训练来平衡视觉和语言知识,提高数据效率)
简介:本文提出VisualGPT,致力于利用大规模预训练语言模型来提高Image Caption任务的数据使用效率。
点击这里阅读详细内容
标题:Generating Human Readable Transcript for Automatic Speech Recognition with Pre-trained Language Model(语音识别中利用预训练语言模型生成人类可读文本)
简介:本文利用预训练模型增强语音