通过Salesforce和亚马逊统一数据,构建强大的AI基础
关键字: [Amazon Web Services re:Invent 2024, 亚马逊云科技, 生成式AI, Salesforce DataCloud, Unified Data Access, Zero Copy Integration, Data Federation, Data Sharing, Customer 360]
导读
在本次会议中,探讨与Salesforce数据云的安全、双向零拷贝集成,以解锁有价值的数据并激活AI/ML预测,从而更有效地帮助个性化客户体验。这种集成实现了实时数据访问,消除了手动复制的需求,并为可信赖的代理体验奠定了基础,提高了运营效率并支持明智的决策制定。本次演讲由亚马逊云科技合作伙伴Salesforce为您带来。
演讲精华
以下是小编为您整理的本次演讲的精华。
在数据统治一切的领域,Salesforce和亚马逊云科技之间出现了一种非凡的联盟,为组织铺平了通往统一数据格局的道路,让它们能够充分利用信息资产的潜力。这种开创性的合作关系在亚马逊云科技 re:Invent 2024活动上揭幕,承诺将彻底改变企业处理数据管理、分析和激活的方式。
主旨发言人Rajkumar(Raj)和Yogesh Dimare登台,展示了这一变革性解决方案,它无缝地将Salesforce的DataCloud与亚马逊云科技强大的服务套件相集成。他们的演讲阐明了组织在处理孤立数据时所面临的挑战,强调了陈旧信息、模式复杂性、治理障碍以及无法及时采取行动获取宝贵见解所带来的挫折。Raj巧妙地表示:“我们认为,在每一个组织中,都有超过一千个应用程序,或者只有2%的应用程序需要应对这个问题。”
Raj阐述了DataCloud的愿景,这是一项开创性技术,可以解放组织内被束缚的数据,使其摆脱不同系统的限制。通过革命性的零复制方法,DataCloud消除了数据复制或重复的需求,确保信息保留在原始的记录系统中。这种创新技术保证了数据的准确性和新鲜度,使实时行动在几秒钟内成为可能,这与传统数据管道的延迟和低效形成鲜明对比。Raj分享了一个金融客户面临的复杂挑战的有力例子:“他们拥有Sales Cloud、Service Cloud。他们是一家大型Snowflake商店。他们决定将Snowflake标准化,这意味着他们必须不断将所有这些数据带入Snowflake,但数据量如此之大,以至于他们需要花费数天,有时甚至数周的时间才能将所有数据导入Snowflake。”
DataCloud的设计理念是开放和可扩展性,支持数百种开箱即用的连接器,可以采用批量、流式和零复制的数据摄取方式。这种灵活性确保组织能够无缝集成现有的数据源,无论其来源或格式如何。一旦摄取,数据就会以数据湖对象的形式落入DataCloud,利用强大的Apache Iceberg表格式,并安全地驻留在Amazon S3存储桶中。
Raj详细地向观众阐述了将数据引入DataCloud的复杂过程,强调了简化数据管理和治理的创新功能。例如,数据空间使组织能够按部门、组织或品牌控制数据可见性,确保用户只能访问他们被授权查看的信息。Salesforce信息模型简化了数据映射,将不同的数据类型和格式统一为规范表示,从而形成统一的Data Model对象。
DataCloud的核心是一种强大的身份解析能力,它构建了所有可用数据的全面图形,使每个个体都能创建一个统一的身份。这一开创性功能为组织带来了无限机遇,使它们真正了解客户,个性化体验,并推动有针对性的激活。Raj强调:“你基本上拥有了所有数据的图形。”
Raj强调了DataCloud的易用性和无代码特性,用户只需简单点击即可创建见解、细分和激活,无需复杂编码或维护复杂管道。这种用户友好的方法延伸到数据操作,允许组织无缝集成外部系统、触发电子邮件活动或启动基于Webhook的激活。他说:“这全都是点击操作。无需编码,对吗?你不需要编写复杂的代码来从头开始维护这些管道。”
与亚马逊云科技服务的集成,尤其是与Amazon Redshift的集成,是演讲的重点。Raj概述了这种集成的两个阶段:查询联邦和文件联邦。查询联邦通过优化查询执行和谓词下推技术,实现对驻留在外部源(如Redshift)中的数据的实时访问。这种方法确保了高效的数据检索,无需物理数据移动。此外,DataCloud还提供了加速功能,可以缓存经常访问的数据,从而实现更快的访问速度。Raj强调:“我们今天管理着许多内部优化,包括查询下推和谓词下推等,因此您可以充分利用实时访问的优势,并借鉴我们多年来在构建这些方面的经验教训。”
第二阶段的文件联邦通过利用Iceberg目录(IRC)实现存储级别的集成,承诺带来更高的性能和效率。
将数据从DataCloud外部共享到Redshift是另一个重点,这得益于与Amazon Lake Formation和Glue Data Catalog的无缝集成。通过这种集成,DataCloud可以将元数据作为安全视图共享到Glue Data Catalog中,让Redshift用户直接访问共享的数据资产。值得注意的是,这种共享过程支持增量数据更新,确保只传播增量变化,从而最小化开销并优化性能。Raj表示:“我们在第一天进行数据访问和共享,因此您可以首次访问所有数据,但从第二天开始,只需共享增量部分即可。”
为了展示这一解决方案的强大功能,Yogesh Dimare登台,并向观众演示了两个引人入胜的演示。第一个演示展示了数据联邦过程,Yogesh将DataCloud连接到一家虚构公司的Redshift实例,选择了相关表格如“网络参与度评分、产品目录、购买历史记录”,将数据映射到Customer 360数据模型,并根据跨DataCloud和Redshift数据源的标准创建了细分。这种无缝集成使得能够创建有针对性的激活,如专注的营销活动,利用统一的数据格局。Yogesh强调:“在大约90万名总客户中,他有效地识别出了82,000名更有可能购买他们产品的客户。”
Yogesh进一步演示了一个用例,其中一家虚构公司Northern Trail Outfitters的数据云架构师旨在将来自Salesforce的Sales Cloud、Service Cloud和Marketing Cloud的数据与驻留在Redshift中的数据(如客户信息、网上购物、产品定价、产品描述和网站点击流数据)统一起来。通过将DataCloud连接到Redshift并映射相关数据源,该架构师可以创建统一的个人资料,并识别出有针对性外联的高倾向性客户,从而实现更加精准的细分和激活。
第二个演示重点展示了数据共享功能,Yogesh在DataCloud中为Redshift创建了一个数据共享目标,选择了要共享的对象,如“案例、个人、身份链接和统一个人”,并链接了数据共享。Yogesh无缝切换到亚马逊云科技用户Maya(一名数据分析师)的角色,演示了如何在Redshift查询编辑器中原生访问从DataCloud共享的数据。Maya可以查询共享的数据,将其与现有的Redshift模式和表格连接,并构建有见地的仪表板,如按产品类别预测流失率,利用DataCloud和Redshift数据的综合实力。这展示了亚马逊云科技用户如何利用Redshift、Athena、QuickSight和SageMaker来分析和从统一数据中获取见解,包括构建机器学习模型进行倾向性评分。
在整个演讲过程中,Raj和Yogesh强调了Salesforce-AWS合作伙伴关系的变革潜力,使组织能够打破数据孤岛,解放被束缚的信息,并充分利用数据资产的价值。通过统一来自不同来源的数据,组织可以推动智能决策、个性化客户体验,并通过高级分析和AI驱动的应用程序推动创新。
随着会议临近尾声,Raj邀请与会者访问Salesforce Bluethread并探索实践演示,进一步巩固这一开创性解决方案的影响力。通过Salesforce和亚马逊云科技的协同效应,通往统一数据格局的旅程已经开启,为企业在数字时代蓬勃发展、释放前所未有的机遇铺平了道路。
下面是一些演讲现场的精彩瞬间:
演讲者强调了与亚马逊云科技和Salesforce合作开发的创新零拷贝技术,为AI和BI应用程序实现了统一的数据访问和激活。
Salesforce首席执行官Marc Benioff在Salesforce展台推广了Agent Force演示,展示了能够理解客户上下文并提供个性化服务的AI驱动代理。
与Snowflake、Databricks、Redshift和Google BigQuery等各种数据源实现无缝数据集成,实现零拷贝访问数据,从而实现统一的数据平台解决方案。
推出了一个强大的无代码平台,只需几次点击即可实现无缝数据操作、洞见生成和仪表板创建。
Bob只需几次点击即可轻松建立与Amazon Redshift的连接,无需编写代码或处理驱动程序兼容性问题。
Bob使用来自Redshift的购买倾向数据创建了一个目标客户群,从90万名客户中识别出82,000名高潜力客户,以进行重点营销激活。
Andy Jassy邀请观众参观Salesforce Bluethread展台并参与实践活动,同时还提供了问答环节,并建议通过博客进一步阅读以获取更多详细信息。
总结
在这场精彩的演示中,来自Salesforce和亚马逊云科技的Rajkumar和Yogesh展示了一种创新的零拷贝数据集成解决方案,该解决方案无缝地统一了来自Salesforce和亚马逊云科技平台的数据。重点亮点如下:
- Salesforce DataCloud利用零拷贝技术访问和激活来自各种来源的数据,包括亚马逊云科技服务如Redshift和Snowflake,而无需复制或移动数据。这确保了数据的新鲜度、准确性和实时访问。
- 该解决方案通过消除复杂的ETL管道和数据复制的需求,简化了数据治理、安全性和访问控制。它提供了跨不同系统的统一数据视图,使企业能够解锁被束缚的数据并获得宝贵的洞见。
- 通过现场演示,他们展示了Salesforce DataCloud与Amazon Redshift之间的无缝集成,演示了用户如何轻松连接、映射和访问DataCloud中的Redshift数据,以进行细分、激活和分析,而无需任何代码或复杂设置。
- 数据共享功能允许用户在Redshift中呈现DataCloud数据,使亚马逊云科技用户能够利用现有工具和工作流程,同时受益于DataCloud中可用的统一数据。
- 该演示强调了该解决方案的可扩展性,允许企业引入自己的模型、与第三方应用程序集成,并通过各种渠道(包括营销活动、广告平台和AI代理如Agent Force)激活数据。
亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者。提供200多类广泛而深入的云服务,服务全球245个国家和地区的数百万客户。做为全球生成式AI前行者,亚马逊云科技正在携手广泛的客户和合作伙伴,缔造可见的商业价值 – 汇集全球40余款大模型,亚马逊云科技为10万家全球企业提供AI及机器学习服务,守护3/4中国企业出海。