景联文科技：提供通用多模态数据，助力AI多模态领域实现飞跃式发展

景联文科技

于 2024-03-15 10:39:29 发布

阅读量650

点赞数 10

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_55551028/article/details/136732982

版权

回顾2023年，以ChatGPT为代表的通用人工智能大模型在全球范围内掀起了新一轮人工智能产业发展浪潮，我国人工智能大模型市场呈现百“模”争鸣、日新月异的迅猛发展态势。

根据大模型之家、钛媒体数据，2023年中国大模型市场规模达到147亿人民币，同比增长110.0%，预计到2028年中国大模型市场规模将达到1179亿人民币。

其中，多模态大模型市场规模有望快速增长。第一财经数据显示，预计至2025年，中国多模态内容市场规模将达到832.7亿美元，2018-2025年复合增长率达65.02%。多模态大模型将主要应用于教育、医疗、游戏、商业定制和影视等领域。

不久前，OpenAI发布首个文生视频模型Sora，极大地推动了AI多模态领域飞速发展，AI创作等相关领域将迎来深度变革，AI赋能范围日益扩大。

高质量的多模态数据是构建和训练多模态大模型的基础，它决定了模型能否有效捕获和利用不同模态间复杂的语义关系，进而影响到模型的整体性能和应用价值。随着多模态技术的发展，多模态数据的需求和重要性日益增加，对于推动人工智能向着更深层次的通用智能方向迈进具有重要作用。

景联文科技是大模型数据供应商，致力于为不同阶段的模型算法匹配高质量多模态数据资源。

通用多模态数据集

音频数据：

普通话(人数 200 万以上，采样率 44.1Khz 及以上，16bit) 100万小时
方言 2.7千小时

图片生成及隐式/显示推理多模态数据：

图文复杂描述 50万本
图文推理问答对 400万本
4K 高清图片 5000万张

视频生成及隐式/显示推理多模态数据：

视频简单描述
视频复杂描述
视频推理问答对

同时景联文科技提供大模型训练数据的标注服务，建立了数据分发、清洗、标注、质检、交付的标准化操作流程，为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的多模态大模型训练数据。

景联文科技｜数据采集｜数据标注｜多模态大模型训练数据

助力人工智能技术，赋能传统产业智能转型升级

文章图文著作权归景联文科技所有，商业转载请联系景联文科技获得授权，非商业转载请注明出处。

景联文科技

关注

10
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
景联文科技：提供通用多模态数据，助力AI多模态领域实现飞跃式发展

高质量的多模态数据是构建和训练多模态大模型的基础，它决定了模型能否有效捕获和利用不同模态间复杂的语义关系，进而影响到模型的整体性能和应用价值。同时景联文科技提供大模型训练数据的标注服务，建立了数据分发、清洗、标注、质检、交付的标准化操作流程，为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的多模态大模型训练数据。根据大模型之家、钛媒体数据，2023年中国大模型市场规模达到147亿人民币，同比增长110.0%，预计到2028年中国大模型市场规模将达到1179亿人民币。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。