一览群智率先开启多模态预训练“大模型”的落地应用，深度探索行业价值

最新推荐文章于 2024-07-15 17:13:02 发布

一览群智

最新推荐文章于 2024-07-15 17:13:02 发布

阅读量930

点赞数

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ElensAi/article/details/115258298

版权

北京智源人工智能研究院发布“悟道·文澜”超大规模多模态预训练模型，一览群智基于此推出智空平台，实现在图像文本生成、智慧城市、个人相册智能搜索等领域的产业应用，展示多模态预训练模型的落地价值。

摘要由CSDN通过智能技术生成

3月20日，北京智源人工智能研究院举办“智源悟道1.0 AI研究成果发布会暨大规模预训练模型交流论坛”。北京市科委、中关村管委会副主任许心超出席会议并致辞。北京大学、清华大学、中国人民大学、中国科学院等高校院所的专家学者，美团、快手、搜狗、360、一览群智、循环智能等AI企业，以及新华社等应用机构代表参会。

随着OpenAI超大规模语言模型GPT-3的发布，预训练语言模型在自然语言理解能力上再次被推至新的高峰。发布会上，中国人民大学高瓴人工智能学院执行院长、智源首席科学家、一览群智首席科学家文继荣教授作了题为《用多模态预训练模型连接图与文》的主题报告，发布了第一代“悟道·文澜”，旨在发掘预训练模型在中文通用多模态数据上的理解能力，并展示了“多模态预训练模型-文澜”方面的技术突破。

“悟道·文澜”是“超大规模多模态预训练模型”，目标是突破基于图、文和视频相结合的多模态数据的预训练理论难题，并最终生成产业级中文图文预训练模型和应用，并在多个评测应用上超过国际最高性能。

据悉，“悟道·文澜”模型参数量达10亿，基于从公开来源收集到的5000万个图文对上进行训练，是首个公开的中文通用图文多模态预训练模型。目前，该模型性能已经到达国际领先水平，在中文公开多模态测试集AIC-ICC的图像生成描述任务中，得分比冠军队高出5%；在图文互检任务中，得分比目前流行的UNITER模型高出20%。

为了展示如何使用“悟道·文澜”模型，智源研究院联合中国人民大学高瓴人工智能学院和一览群智，推出“AI心情电台”小程序，利用图片和歌词的相关性，为用户上传的照片搭配最合拍的音乐。

布灵-为图片赋予音乐的灵魂

用户随便上传一张图片后，布灵为用户配上一首符合意境的歌。《AI心情电台》是使用BriVL提取图像和文本特征，接着进行图文检索，将图片和歌词特征进行匹配，并将歌词准确定位到最符合图片特征的歌词位置。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
一览群智率先开启多模态预训练“大模型”的落地应用，深度探索行业价值

3月20日，北京智源人工智能研究院举办“智源悟道1.0 AI研究成果发布会暨大规模预训练模型交流论坛”。北京市科委、中关村管委会副主任许心超出席会议并致辞。北京大学、清华大学、中国人民大学...
复制链接

扫一扫

一览群智 CSDN认证博客专家 CSDN认证企业博客

码龄5年

9: 原创

-: 周排名

188万+: 总排名

4万+: 访问

: 等级

270: 积分

16: 粉丝

9: 获赞

9: 评论

59: 收藏

私信

关注

热门文章

最新评论

12345市民服务热线背后：知识图谱与智慧政务的新火花
plasf123: 请问针对这个项目有没有什么开源的代码或者论文推荐
12345市民服务热线背后：知识图谱与智慧政务的新火花
南通大学物联网211赵耀: #include <stdio.h> #include <unistd.h> #include <sys/types.h> #include <sys/wait.h> int main() { int file_descriptor; pid_t child_pid; // 打开文件 file_descriptor = open("output.txt", O_CREAT | O_WRONLY | O_TRUNC, 0644); if (file_descriptor == -1) { perror("Error opening file"); return 1; } // 创建子进程 child_pid = fork(); if (child_pid == -1) { perror("Fork failed"); close(file_descriptor); return 1; } if (child_pid == 0) { // 子进程 printf("Child process ID: %d, Parent process ID: %d\n", getpid(), getppid()); write(file_descriptor, "Message from child\n", 20); } else { // 父进程 printf("Parent process ID: %d, Child process ID: %d\n", getpid(), child_pid); write(file_descriptor, "Message from parent\n", 21); // 父进程等待子进程结束 // 如果没有这一行，父进程和子进程可能会并行执行，导致输出交错 wait(NULL); } // 关闭文件 close(file_descriptor); return 0; }
标注跨越多领域智能标注平台新增图片标注功能
qq_36647519: 想了解下这个平台，怎么联系
悟道·文澜：北京智源研究院、人大、中科院联手打造的超大规模多模态预训练模型！
贰柒: 你好，我想问一下，这个代码在哪里可以找到
一览群智受邀参加亿欧2020年度分析师发布会，浅谈数字化转型应用落地。
water___Wang: 有学习到一些东西，加油~

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。