生成式AI落地指南,加速千行百业前行

如今,生成式AI呈现爆发增长,人工智能场景愈发丰富多样,如大众常见的文生文、文生图、知识问答、产品设计等等都在不断创新。但随之而来的问题是,如何才能更好地推动生成式AI应用落地,以及重塑未来产业价值?

作为产业创新及能力搭建的重要角色,云厂商亟需发挥其能力。毕竟在整个数字化转型进程中,云计算的普及为众多受制于IT基础设施的企业提供了全新的升级路径;而如今,有目共睹的是云厂商正全面重构生成式AI的基座,奠定了场景落地的坚实基石。

在Gartner发布的《2023年云AI开发者服务魔力象限》报告中,亚马逊云科技连续第四年被列为“领导者”之一,并在纵轴执行能力维度处于最高位置。在生成式AI引领的变局中,亚马逊云科技同样当仁不让,率先在各行各业积累了一批可供示范的落地案例,为企业级生成式AI的进阶树立了新标杆。

打破数据孤岛,构建企业级智能知识库

创新是企业韧性成长的要素。西门子作为全球电子电气工程的老牌王者,对此早有洞察。如何更好地发掘数据价值成为其持续发力的重要方向。

负责IT数据分析与人工智能的西门子中国大禹团队为此进行的探索之一是搭建企业知识库,一方面,便于更好地进行企业知识资产的挖掘和保护,另一方面,让员工在业务活动中能更快捷、精准地获取相关知识,帮助其提升专业能力,让企业知识“活”起来,提升知识重用率。

但是在搭建过程中,大禹团队逐渐发现,长期以来企业内部资源的检索和调用都存在结构散乱、检索速度慢、交互不便等问题。而且由于横跨多个不同领域、涉及多个不同业务单元,如若以传统方式打造知识库,这些问题将始终横亘其中。因此,大禹团队决定将大数据库和生成式AI应用于一个全新的“智能知识库”,从根本上提升知识库的可用性。

在此诉求下,有着长期良好合作基础的亚马逊云科技再次成为西门子合作的首选。在深入调研和全盘考量后,最终亚马逊云科技为大禹团队提供的是一个智能知识库暨智能会话机器人的解决方案指南,能实现目标知识库约80%功能,西门子中国根据企业内部需求再做20%定制化开发,最终形成完整的解决方案。

在整体解决方案中有三大亮点:

其一,采用**“RAG 架构+向量数据库”**设计,核心主体知识库以向量方式构建,能够存储超大规模的向量数据。另外,RAG 架构保障了知识库在不影响访问速度的前提下,拥有了近乎无限的可扩展性,极大地拓展了大模型的可用性;

其二,开源搜索引擎Amazon OpenSearch Service 的无服务器特性让开发人员不需要管理集群或担心生产规模,可以快速推动部署;

其三,机器学习服务Amazon SageMaker上提供了丰富的模型开发和训练工具,保证客户可以在云端轻松实现大语言模型的调优以及测试更多不同类型的开源模型。

最终大禹团队在亚马逊云科技的支持下,仅用三个月就完成了生成式AI对话机器人“小禹”的开发、部署与上线。相较传统机器人,“小禹”的回答内容不仅生成速度更快,其对搜索关键词的命中率也更高,用户体验更优。西门子中国专属智能知识库上线后,首周就有超过4000位内部用户参与使用,超过12000个问题被提出并解答。

发力在线教育,触发教学模式全蜕变

纵观历史,每一轮科技革命都会给教育形态带来深刻变化。生成式AI同样正在触发教育教学模式的深层次变革。

作为外研社推进数字化转型的载体,外研在线正在积极投入生成式AI建设,以期实现对外语教学的智慧化提升。不过,进行大范围的生成式AI探索与测试的前提,是有灵活、易部署、高效的底层基础设施架构予以支持。

因此,外研在线的人工智能团队首先详细评估了生成式AI对业务的影响与挑战;再者,外研在线希望对市面上主流的基础大模型进行大范围的评测和试用,以选择出最适配自身教学环境的基础模型工具。与此同时,为了满足长期持续的推理需求,外研在线还需要进行数据的清洗,模型的定制化、量化、微调和压缩等优化工作,以降低大语言模型的使用成本。

综合考虑上述需求后,与外研在线有多年成功合作经验的亚马逊云科技脱颖而出。在拓展生成式AI应用时,外研在线同样选择基于亚马逊云科技基础设施和产品服务进行构建。

完全托管式机器学习服务Amazon SageMaker为企业提供一整套工具和框架,包括数据标注、模型训练、模型部署、自动化建模等功能,这套端到端模型部署方案,可以实现基础模型的二次开发微调,为所有开发人员构建、训练和部署模型提供便利。

在搭建生成式AI平台时,外研在线正是采用了Amazon SageMaker为大模型进行微调,而数据处理部分由云服务器Amazon EC2承担工作负载,处理第三方的开源数据集,并使用云存储Amazon S3保存AI模型的各种数据和模型文件,以此获得在大模型上更便捷地构建生成式AI应用的能力。

对于外研在线格外关注的大模型部署问题,亚马逊云科技提供了丰富的专业技术支持资源,其专业服务团队与外研在线通力合作,协助评测了市面上几乎所有的大模型和生成式AI工具,并针对不同的应用场景完成多次POC测试。同时采用 Amazon SageMaker 部署了多个大模型进行测试和比较,直观演示实时推理,运行批量推理任务,使繁复的测试变得简洁高效,确保外研AIGC平台按时上线运行。

在亚马逊云科技助力下,外研在线推出了 iTEST、iWrite、iTranslate 等提供智能点评、译文润色的新服务,实现基于项目的学习、人机交互式共创学习、无限个性化学习、沉浸式学习等新学习方式,帮助学生获得更好的学习体验,同时也减轻教师的工作负担,达成了提高教学效率和质量的目标。

加码智能制造,按下云上工业设计快进键

随着智能家居产品的不断升级,市场对产品的工业设计和上市速度提出了更高的要求。成立于1994年的海尔创新设计中心为海尔智家旗下七大品牌全球的所有产品提供设计创新和模式探索。为了更好地服务用户,数字化重构势在必行。

**数字化要和最新的行业应用结合,要达到资源的最高效配置,**这是海尔设计数字化转型的两个要点。此前,海尔设计使用的是自建的私有云系统,部署在自有 IDC 内。这套私有云系统存在诸多问题:桌面系统资源挤兑、文件存储系统因容量受限无法长期保存历史文档、渲染系统由于资源受限渲染任务需要长时间的排队等待,以及基础系统维护复杂、无法弹性扩展等,对业务产生了较大影响。

海尔设计希望通过数字化转型提高设计效率的同时,还能获得全新的方案和思路,去帮助设计打开市场局面、更好应对全球化挑战,这是海尔设计最终选择与亚马逊云科技合作的主要原因。

据此,亚马逊云科技为海尔设计提供了四个完整的云上解决方案,全面替代自有机房,让设计中心的工作流程实现全面云化。具体而言,包括3D云桌面系统、文件共享系统、渲染农场系统以及自动化设计系统等四个部分:

3D云桌面系统:在海尔设计的青岛办公室,3D云桌面系统为300多位3D设计师、平面设计师提供便捷易用的桌面环境。通过公有云上的资源隔离划分,海尔设计在彻底解决原自建IDC的VDI方案“资源挤兑造成卡顿、闪退或宕机”以及“多人使用时性能衰退”等问题的基础上,还能有约30%性能提升,可谓一举多得。

文件共享系统:基于Amazon S3特性构建的文件共享系统,让公司、小组和个人之间得以共享存储。这种对冷热数据进行自动分层的无限容量存储系统让数据安全性提高了3倍,而此前自建 IDC 每人最大分配500G容量、每天只允许一个备份且最多保留7天的设定,自此成为历史。

渲染农场系统:在搭建渲染农场系统时,部署了亚马逊云科技自有渲染产品 Amazon Thinkbox deadline软件及HPC集群进行图片渲染,具备高性能和弹性,让设计师提交任务后就能拿到渲染效果图,彻底解决渲染任务排队问题。而低负载时它会自动降低Amazon EC2 Spot数量且按实际使用时间(精确到秒)付费,从此不再浪费。

自动化设计系统:自动化设计系统/智能设计渲染系统通过Amazon EC2、Amazon Thinkbox Deadline、Amazon DynamoDB等运行自动化设计软件,10分钟就能自动生成人工需要数天才能完成的大批量渲染效果图,彻底解决了原自建IDC存在的算力瓶颈问题。

亚马逊云科技为海尔设计中心量身定制的这四套系统形成了完善的端到端的工业设计解决方案,让设计中心的工作流程实现了全面云化、自动化。上线后,自动化设计系统应用让原有项目周期缩短了 30%,获得巨大成功,成为了工业设计行业的样本型范例。

助力服务升级,深耕跨境电商业务场景

多年来,电商领域都在探索着以更好的技术工具实现降本增效的路径。而随着生成式AI的突破性发展,人工智能生成的营销内容和图片在电商领域也迎来了爆发期。

店匠科技是一家专注于全球独立站销售的SaaS企业级技术公司,聚焦跨境电商场景。在与商家的交流中,店匠科技发现,服装鞋帽类产品更新迭代快,对内容素材要求高、作图压力大。因为素材图片的拍摄和处理不仅涉及到拍摄创意、版权、成本等问题,还需要考虑面对不同国家消费者、模特和产品展示的多样性。

为了更好地服务服装商家,针对其素材图片制作成本高、需快速上架等痛点,店匠科技决定推出人工智能生成的图片应用—— BetaCreator。

但要开发这款新应用,店匠科技要面对不少挑战:第一,电商行业发展迅速,企业自身构建和部署模型耗时耗力且不易灵活扩展;第二,人工智能生成的图片有一定的算法和工程门槛,企业缺乏专业的算法人员以及成熟的实践经验;第三,新应用的用户体验至关重要,需要创新、易用的人工智能技术来满足和优化这些需求。

综合考虑下,店匠科技最终选择了与亚马逊云科技一起攻坚这些难题。

双方倾力合作下,店匠科技将模型轻松托管在Amazon SageMaker上,在此基础上,不但快速构建了BetaCreator,还迅速完成了模特生成、模特换脸、商品变款、背景更换、创意爆款等应用场景的实验,不但帮助商家快速实现了电商素材图片的自动生成和自动化处理,还保障了生成的电商素材图片在细节、质量和连贯性方面都有生动逼真的表现力。

另外,Amazon SageMaker JumpStart机器学习中心还为店匠科技提供了数百种内置算法以及经过预训练的模型库,加速模型的构建和部署。同时,Amazon SageMaker JumpStart还提供了负责任的人工智能技术,自身带有鉴黄、鉴恐等功能,若有涉黄涉恐的输入或生成内容,会自动打码、降低风险。

从构思产品原型到最终上线的整个过程,亚马逊云科技技术团队为店匠科技突破技术难关提供了全方位的技术支持与服务。

店匠科技通过使用Amazon SageMaker全托管式服务,大大提高了机器学习模型的训练速度和效率,使产品的开发周期从过去的6个月缩短到2个月,显著降低了模型训练和调优的时间成本。加上Amazon SageMaker JumpStart提供的不断更新的模型库,店匠科技得以轻松灵活尝试新的模型来优化产品功能。

整体而言,在此基础上构建的BetaCreator不仅节省了商家广告投放时不同素材图片的测试时间,还大大提升了电商素材图片的产出效率,为生成式AI在电商领域的落地提供了又一代表性范例。

结语

在上述案例中,生成式AI一次又一次与各行业融合,成为重塑企业关键产业的强大力量。但潜在思考一下,如果AI真的把所有应用、所有产品都重做一遍,所带来的变化是否能够被想象出来?

前景和现实的差距不用多说,生成式AI落地千行百业,目前的确存在难以跨越的鸿沟,想要把人工智能与业务相结合,这种能力对于企业来说还需努力前行才能具备。

但今年生成式AI如飓风般汹涌,亚马逊云科技作为全球云计算领导者,其当前的技术路线选择及实战路径,正在促使其成为更多企业践行生成式AI战略的合作伙伴。一个个案例的打造,得以证明。未来,各行业企业或许能从这些范式案例中有所收获,以此借鉴形成属于自身的生成式AI用云图鉴。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值