揭秘1万家公司AI应用的真相-1

近期,一家名叫Databricks的公司发布了一个真实客户的AI应用报告。报告基于Databricks数据智能平台及其广泛生态系统的客户匿名数据编制而成,涵盖了从2023年2月1日至2024年3月31日的数据,涉及从初创企业到世界最大企业的全球超过10,000家客户,其中包含300多家《财富》500强企业。报告旨在帮助企业构建适应企业AI时代演变的有效数据策略,通过分析机器学习趋势、生成式AI采纳情况、集成与用例,揭示最具创新力的组织如何成功运用机器学习、接纳生成式AI并应对不断变化的治理需求。

图片

本文主要节选部分内容进行分析解读,进行分享,供各位读者参考!公众号后台私信关键字AI报告可获取完整报告pdf文档。

扩展阅读:


在Databricks发布的《数据+AI现状》报告中,揭示了多个关于数据智能与生成式人工智能(GenAI)应用的重要发现,主要有以下几个关键点:

图片

  1. 生成式AI的普及与定制化趋势:生成式AI的应用正在快速扩展,企业正热衷于通过检索增强生成(RAG)技术,使用他们的私有数据定制大型语言模型(LLMs)。RAG的实施需要向量数据库,这一领域的使用量在过去一年中增长了377%,显示了企业对定制化GenAI解决方案的强烈需求。

  2. 模型部署效率显著提升:企业将模型从实验阶段推进到生产环境的效率提高了三倍。这一转变体现在模型注册与实验记录的比例从16:1降低到5:1,意味着企业能更快地将模型投入实际应用,减少了资源浪费。

  3. 开源模型的广泛应用:开源技术在企业AI战略中占据重要地位,90%的顶级数据和AI产品都是开源的,包括Hugging Face和LangChain。尤其在金融服务业,76%的公司使用开源LLMs,经常与专有模型并行,这表明企业倾向于在成本、性能和延迟之间找到平衡,同时追求创新和定制化。

  4. 自然语言处理(NLP)的主导地位:NLP连续两年成为最广泛使用的数据科学与机器学习应用,占所有专业Python库使用量的50%。NLP的年增长率也最高,达到75%,并在不同行业中得到广泛应用,尤其是在医疗健康与生命科学领域,NLP的应用比例高达69%。

  5. 行业间的差异性:尽管所有行业都在加速AI应用,但不同行业的具体策略和效率存在差异。例如,零售与消费品行业在将模型投入生产方面最为高效,而制造业与汽车行业在NLP应用上的年增长率最高,达到148%。

综合来看,这份报告描绘了企业如何在数据智能和AI的浪潮中加速转型,从增加模型部署效率到积极采用开源工具和定制化解决方案,再到重视NLP等关键技术的应用,揭示了数据驱动决策和AI集成已成为现代企业不可或缺的一部分。报告为希望在AI时代保持竞争力的企业提供了实用的洞见和策略指导。

ML模型部署的转变

在过去一年中,企业从探索性实验转向生产应用的进程显著加快。数据显示,相比前一年,有56%更多的公司记录了实验性模型,但注册用于生产的模型数量增长了210%,表明许多企业已从实验阶段迈入实际应用。总体上,模型注册量较去年上升了惊人的1018%,而记录的实验数量也增长了134%。这一趋势不仅体现在总体数据上,单个企业的平均模型注册量也增长了261%,实验记录则增加了50%。这说明企业正越来越重视将数据科学和AI项目转化为实际价值。

图片

生产效率的大幅提升

企业将模型投入生产的效率提高了三倍。2023年2月,每16个实验模型中只有1个会被注册为生产模型,到了2024年3月,这个比例缩小到了每5个实验模型就有1个进入生产,效率提升显著。这意味着企业在减少资源浪费、加速价值实现方面取得了实质进展。

图片

从2023年2月1日至2024年3月31日,记录到注册模型的比例稳步下降,这意味着更多原本处于实验阶段的模型被成功部署到了生产环境中。这一变化反映企业正变得更加高效,能够更快地将实验成果转化为实际价值。

图片

  • 零售与消费品行业:在这个行业中,效率最高,达到每四个实验模型就有一个投入生产的比率。这归因于行业内部的竞争压力和消费者期望的双重驱动,促使零售业成为早期AI应用的领头羊。

  • 金融服务行业:虽然该行业在初期的测试最为密集,平均每29个实验模型才有1个进入注册阶段,但在观察期间,其效率几乎提高了三倍,最终达到10:1的比例。对于受到严格监管的金融服务业来说,长时间的测试周期至关重要,因为生产环境下的ML失误可能带来更高风险。

自然语言处理(NLP)的主导地位

自然语言处理(NLP)的爆炸性增长标志着它连续两年成为数据科学与机器学习领域中最受瞩目的应用。在各行各业和地区中,非结构化数据无处不在,要从这些数据中提取意义,NLP技术变得至关重要。生成式人工智能(GenAI)作为NLP的一个关键应用场景,进一步推动了这一领域的快速发展。

Python库在机器学习的进步和人工智能发展中处于领先地位,其普及度持续位于编程语言前列,因此本报告聚焦于Python库的使用情况。通过对组织内部使用的专门Python库进行汇总分析,我们确定了五个最常应用于数据科学和机器学习(DS/ML)的领域。NLP再次位居榜首,这反映了其在解决实际问题、挖掘非结构化数据价值方面的核心地位。

图片

具体而言,数据表明大约50%的专业Python库与NLP有关,这证明了NLP在数据处理、文本分析、语音识别、机器翻译等领域的广泛应用。NLP技术不仅帮助医疗健康与生命科学行业分析临床研究、加速新药上市,还增强了销售与营销活动的效率,同时在制造业与汽车行业中,NLP的年增长率达到了148%,显示出其在客户服务反馈分析、质量控制监控以及智能客服系统方面的巨大潜力。

图片

  • 29
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

古猫先生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值