星尘数据入选“智赋百业”2023年人工智能融合发展与安全应用典型案例

星尘数据的COSMO大模型数据金字塔解决方案因其在AI基础支撑方面的优秀表现入选典型案例,通过多层次数据满足AI训练需求,助力AI向理解和人性化发展,同时保障内容健康。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

9 月 6 日,国家工业信息安全发展研究中心公布“智赋百业”2023年人工智能融合发展与安全应用典型案例评选结果,星尘数据凭借业内领先的“COSMO大模型数据金字塔解决方案”成功入选!

图片

图片

星尘COSMO大模型数据金字塔解决方案入选方向为启智型——AI 基础支撑。众所周知,AI 大模型训练数据需求激增,高质量数据集成为 AI 大模型进化的关键支撑。本次入选,是国家工业信息安全发展研究中心给予星尘数据的充分肯定,也是星尘作为 AI2.0 时代的数据标注和数据策略专家,赋能千行百业的又一例证。

今年 6 月,星尘数据正式对外发布COSMO大模型数据金字塔解决方案,致力于通过一个完整的、结构化的、多元化的、包罗万象的数据体系提升模型的上限。我们的目标是用数据赋予AI理解世界的能力,让AI拥有人类般的思维和逻辑,塑造其价值观,使其明辨善恶,同时保证其输出内容健康、无害,最终通往AGI。

该方案包含四层数据结构,以满足各行各业不同场景的需求,为大模型提供一站式数据策略和数据服务解决方案。

图片

0层 :公共数据

作为大模型预训练的基础,提供大量经过清洗和加工的公共数据集,打造大模型的知识体系和世界观。

1层:通用能力数据

为大模型微调提供高质量的数据,包括SFT、RLHF数据集以及涵盖语文、数学、化学、多轮对话等领域的难例数据,弥补公共数据的不足。

2层:专有能力数据

针对特定领域和应用场景,我们提供了丰富的专有能力数据集。如:思维链、插件调用能力、社会主义价值观对齐、行业专业词汇等,这些专有能力数据集将帮助模型实现更精准的定位和更高效的性能表现。

3层:企业私有化部署数据

面向各行各业的企业和单位,提供可进行私有化部署的私域数据集搭建服务,以满足定制化需求和内部知识库的构建。

图片


我们为各垂直行业提供了定制化的大模型数据解决方案,如医疗、法律、媒体、金融、教育、游戏等,同时提供大模型的benchmark 测评服务。如果您正在寻找大模型中文数据解决方案,请联系contacts@stardust.ai。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

星尘数据Stardust

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值