一文读懂首款专注数据价值发现的产品MorningStar

国际AI公司星尘数据在北京发布了MorningStar,一款专为AI2.0时代设计的数据闭环平台,旨在提升数据管理效率,解决数据债问题,助力企业构建高效数据循环,实现模型效果最优化。平台涵盖了数据发现、管理、协作和迭代等功能,适用于算法工程师、业务人员和技术管理人员。
摘要由CSDN通过智能技术生成

3月11日,国际领先的AI数据技术公司星尘数据(Stardust AI)在北京举办2024年春季产品发布会,重磅推出MorningStar,一款面向AI的数据闭环产品。MorningStar是首款专注数据价值发现的AI数据平台,相较于传统的数据管理工具,这款理念先进、操作便捷、功能丰富的AI数据发现、管理、协作、迭代平台,专为发现数据价值,加速模型迭代,解决AI数据债问题打造,能够支撑企业Al数据高效迭代的关键环节,避免数据债风险积聚、低价值数据成本浪费、模型训练与应用效果反馈链长等问题

图片

▲MorningStar正式发布

一、MorningStar是什么?

MorningStar是一款满足AI2.0时代数据管理需求的全能工具,旨在为算法工程师提高非结构化数据管理效率,为公司节省数据资产管理成本和模型上线迭代时间,以领先的数据生命周期管理、全面的数据挖掘工具、强大的指标追踪与难例发现能力、高效合规的数据资产管理等产品优势,远超国内外同类产品,让算法开发更流畅、更敏捷,让数据价值得以全面释放。

图片

▲MorningStar数据闭环

二、MorningStar的用户是谁?

通过打造以数据为中心的协作环境,MorningStar能够消除企业AI数据债问题,主要服务三类用户:机器学习算法工程师、业务人员、技术管理人员。针对不同的用户,MorningStar能够满足各类不同需求,涵盖数据难例发现和模型迭代,指标跟踪;数据价值挖掘、业务效果反馈,运营测试;数据要素管理和企业价值沉淀等丰富的使用场景。

三、为什么选择MorningStar?

数据技术已经推动了人工智能的三次变革。在大模型时代,各行各业都需要基于自身数据打造超级员工,以提高企业的生产效率。模型和算力可以购买,但数据需要精细化、全流程的管理,才能释放真正的价值。企业需要搭建一个可发现、可管理、可协作、可迭代的数据管道,才能具备获取数据、生产数据、持续迭代数据的能力,促进内部以数据为中心的协作,从而在AI2.0时代中获得核心竞争力。

MorningStar是市面上唯一一个专为AI2.0时代企业打造的数据闭环产品,全面覆盖AI算法从训练到生产全链路中的数据管理、迭代、优化、挖掘等闭环链路,致力于帮助企业建立高效的数据闭环系统,实现数据价值最大化和模型效果最优化,助力打造差异化竞争力壁垒。

图片

▲MorningStar产品优势

四、MorningStar的核心功能

图片

▲AI数据发现、管理、协作、迭代平台MorningStar

领先的数据生命周期管理

算法工程师可以通过MorningStar进行AI数据生命周期的管理,强化数据版本控制、快捷数据切片、可追溯数据血缘和安全管控。平台的自动化工作流能够确保数据在每个阶段都能得到妥善管理和最优化处理。

图片

▲数据切片

灵活的数据切片功能,算法工程师能够一键选定算法迭代数据方向,用于后续数据处理流程。

图片

▲数据流:记录数据包含不同语义信息的版本生产流程

数据流程编排和调度,算法工程师可以方便地记录数据处理过程和语义结果并进行版本管理,记录全生命周期数据信息,确保数据的可追溯性和操作的可复现性。

图片

▲数据流:数据来源和数据送标

算法工程师可以通过平台进行模型真值对比,通过一系列数据追溯、模型调试和分析生成工具,发现难例数据,一键送标至Rosetta数据标注系统。

全面的数据挖掘工具

MorningStar支持深入挖掘数据价值,包括细颗粒度可视化、指标计算、数据分布探索、跨模态数据检索等,能够通过人工监督、语义检索、特征生成和数据增强等手段,用更低成本获取最优算法,并通过可视化的数据挖掘逻辑,帮助用户发现并解决模型训练中的难题。

图片

▲数据分布可视化

上图展示了MorningStar通过可视化数据挖掘逻辑,找出难例数据和标签分布异常的数据,具备丰富的可扩展性。

图片

▲数据探索

算法工程师能够使用MorningStar进行各类场景、各种维度的数据检索,快速掌握数据情况,制定算法实验思路。

图片

▲支持多模态数据       

图片

 ▲语义检索

MorningStar支持各类型多模态数据可视化,语义检索,更便捷快速地定向挖掘所需的高价值数据。

强大的指标追踪与难例发现能力

作为首款集合难例发现策略的数据闭环产品,MorningStar能够保证模型训练过程可追踪可迭代。通过一系列数据追溯、模型调试和分析生成工具,助力实现和维护高质、可复现的Al模型。

图片

▲数据溯源

通过数据流实现对算法评测所用数据的随时溯源。

图片

▲版本对比

通过选择不同的数据版本,实现算法预测结果和真值的对比,并结合可视化功能便捷地定位和分析难例数据。

图片

▲指标追踪和效果检测

MorningStar通过SDK便捷地打通模型训练环境和训练数据分析管理、指标分析环境,便捷地进行算法迭代。

高效合规的数据资产管理

MorningStar支持对数据集进行全面的分析,助力经营管理负责人实现企业级数据要素管理分析,一览呈现数据资产规模、内容分布、归属权等维度的资产信息。

图片

▲数据合规审计

团队可以通过MorningStar整合数据资产,共享使用价值。通过权限管理和使用记录,加速各部门之间的数据流通,同时保证数据安全。 

图片

▲数据资产展示

此外,MorningStar整合多源、多格式、异构数据,管理超大容量数据,实现企业资产可视化建模;支持对多维度细粒度数据的分类盘点,促进企业内部数据深度理解,提高企业跨部门协作中数据流转效率。

图片

▲数据价值分析

上图展示了通过MorningStar进行数据集热度值排名,通过数据使用次数、场景标签、标注结果等评价数据资产对算法迭代价值,助力数据要素的经济效益分析。

更多功能

作为一个优秀的算法工程师,还在用原始的自建工具、临时工具,甚至Excel来处理数据吗?MorningStar作为专业的AI数据发现、管理、协作、迭代平台,除了能够让你进行以上高级操作,还有丰富的实用功能!例如支持多源、多格式、异构的结构化数据统一管理;支持SDK,可以进行模型的性能评估和监控,获得全面的模型评估报告。

值得一提的是,星尘数据联合国内外知名机构和学者打造的CIF-Bench自动化评测即将上线MorningStar!28个模型评测榜单,重点评估了20 种基础维度,考察模型在150 类任务上的指令遵循能力,榜单链接:https://yizhilll.github.io/CIF-Bench/。

一位自动驾驶算法工程师曾反馈,原本需要花费1天时间才能发现的难例,通过平台只需要1-2小时即可,大大提高了迭代效率。

未来,MorningStar还将持续进行迭代更新,欢迎各位使用者为我们提出宝贵的建议,和我们一起重构数据闭环管理,让AI算法迭代更高效!

图片

▲星尘数据创始人&CEO章磊

据星尘数据创始人&CEO章磊介绍:“在AI2.0时代,掌握自己的数据就是掌握自己的模型。”企业数据价值的核心在于定义、管理和迭代数据。在不断演变的AI技术浪潮中,持续管理、优化和迭代数据将成为企业在AI2.0时代脱颖而出的关键因素。

如果您的企业希望利用自有数据和百亿级大模型打造出自己的超级员工,MorningStar诚挚地邀请您与我们进行沟通。无论您是哪类有AI数据管理需求的用户,MorningStar都能提供全面的解决方案和灵活的使用方式,包括SaaS、企业私有化部署以及支持软件定制化开发。

产品官网:

https://stardust.ai/MorningStar

需求提交:

https://stardust.ai/contact

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值