一年一度亚马逊云科技重要的技术盛会 re:Invent 刚落下帷幕,2023 亚马逊云科技 re:Invent 中国行就将其中重要的信息与内容带给了中国市场和用户。作为全球的云计算巨头,今年亚马逊云科技可以说全面加码 AI,例如发布完整的端到端生成式 AI 技术堆栈,分享在各行业生成式 AI 用户案例,助力中国初创 AI 企业创业等等。
在年底的重磅大会 re:Invent 上,亚马逊云科技再次以逆向工作法从数百万客户需求出发,面向生成式 AI,重塑云上的基础设施、存储、通用型计算芯片、无服务器 Serverless,为 AI 底层算力、模型构建工具、AI 应用、AI 数据系统,提供全方面的 AI 能力服务。
面向 AI,重塑云上基础设施、存储、芯片、Serverless
亚马逊云科技云还在继续扩充基础设施的区域和规模,2023 re:Invent 上亚马逊云科技宣布计划新增 5 个左右的区域,提供全球一致的体验,高可用和灾难恢复能力。数据中心数量比第二大的云提供商多三倍,服务多 60%,功能多 40%。除了公共互联网连接外,Kuiper 团队已将首批两颗原型卫星送入轨道,Amazon Kuiper 近地轨道卫星网络将提供企业就绪的专用连接服务。
2023 re:Invent 上亚马逊云科技重磅的 S3 存储类别也推出新服务 Amazon S3 Express One Zone。Amazon S3 Express One Zone 采用专门设计的软硬件来加速数据处理,可提供比 Amazon S3 标准存储快 10 倍的性能,同时能够以一致的毫秒级延迟处理每分钟数百万次的请求,同时请求成本降低了 50%。这项新服务帮助 Pinterest 提升了 10 倍以上的写入速度,并将其机器学习驱动的视觉灵感引擎的总成本降低了 40%。
有超过 5 万客户在使用的 Graviton 芯片最新进展是 Amazon Graviton3 处理器的 Amazon EC2 C7g、M7g、R7g 实例在亚马逊云科技中国(北京)区域和中国(宁夏)区域正式可用,并且 2023 re:Invent 推出自研芯片 Amazon Graviton 4,平均性能比 Amazon Graviton 3 提升 30%,对某些工作负载的加速更明显,数据库应用程序速度提升 40%,大型 Java 应用程序速度提升 45%(基于 Amazon Graviton 4 的 Amazon EC2 R8g 实例的预览版已经推出)。
针对更具弹性和成本的云原生 Serverless 服务形式,2023 re:Invent 发布了三项新的服务,分别是 Amazon Aurora Limitless Database、Amazon ElastiCache Serverless、Amazon Redshift Serverless。详细来说:
- Amazon Aurora Limitless Database,它简化了跨单台服务器读写吞吐量限制进行扩展,实现自动分布式分片,最大程度提升性能。它还提供了跨分片事务的一致性。通过 Aurora Limitless Database, 客户可以实现真正意义上的无扩展上线的关系性数据库。
- Amazon ElastiCache Serverless,可以帮助客户在一分钟内创建高可用的缓存,并实时进行垂直和水平扩展以支持客户复杂的应用程序,且无需管理基础架构。
- Amazon Redshift Serverless 新的基于 AI 的扩展和优化功能的预览,可根据多个工作负载维度自动调整资源并执行优化操作以完成预设的性价比目标。
现在亚马逊云科技的无服务器创新已经覆盖了亚马逊云科技推出的无服务器产品例如 Amazon DynamoDB 高性能数据库;2006 年 Amazon S3 和 Amazon SQS,弹性文件系统 EFS、Serverless 计算服务 Amazon Lambda、无服务器容器服务 Amazon Fargate 等。
从算力、开发工具、应用、数据,增强 AI 能力,降低 AI 门槛
全面加码 AI 的亚马逊云科技希望为千行百业降低应用生成式 AI 的开发和使用门槛,例如如何兼顾规模与成本,真正让业务收益,如何选择最适合业务场景的模型,如何用企业自己的数据定制并快速行动,当然还有如何充分保护数据的安全隐私的前提下负责人的应用生成式 AI。亚马逊云科技从底层算力、开发工具、AI 应用 3 个不同层面展开持续投入。
在 2023 re:Invent 上,亚马逊云科技发布了自研芯片 Amazon Trainium2,用于生成式 AI 和机器学习训练,针对训练具有数千亿至数万亿参数的基础模型进行优化,相较 Amazon Trainium 4 倍性能提升,65 exaflops 的按需超级计算性能。还有 Amazon SageMaker HyperPod 服务可大规模加速基础模型训练,能够缩短高达 40%的训练时间,并可以确保持续数周或数月的训练过程不中断。另外 re:Invent 2023 上,亚马逊云科技和英伟达共同宣布了几项最新合作,例如亚马逊云科技将提供首款搭载 NVIDIA Grace Hopper 超级芯片和亚马逊云科技 UltraClusters 技术的云 AI 超级计算机等。
在 AI 工具方面,Amazon Bedrock 最新可支持 Anthropic Claude 2.1 和 Meta LLama 2 70B。Amazon Titan Text Embeddings 模型最新可将文本转换为向量。还有轻量级的 Amazon Titan Text Lite、支持大参数的 Amazon Titan Text Express、文生图模型 Amazon Titan Image Generator。另外还有可用于行业模型的 Amazon Bedrock 持续预训练、微调、知识库检索增强生成、代理,以及通过负责任的人工智能策略来保护生成式人工智能应用程序 Guardrails for Amazon Bedrock 预览版。
另外亚马逊云科技还发布了生成式人工智能工作助手 Amazon Q,可集成至 AI 代码开发 Amazon CodeWhisperer、兼容流行数据源的内置连接器、BI 应用 Amazon QuickSight、云联络中心应用 Amazon Connect。
对于生成式 AI 另一个重要的数据基础设施,2023 re:Invent 发布了新增 Db2 数据库托管的 Amazon RDS for Db2,向量数据搜索服务 Amazon OpenSearch Serverless,新增向量搜索功能的 Amazon DocumentDB 和 Amazon DynamoDB、Amazon MemoryDB for Redis,Zero-ETL 功能的 Amazon Aurora PostgreSQL、Amazon RDS for MySQL 和 Amazon DynamoDB 与 Amazon Redshift 的 Zero-ETL 集成预览版,AI 描述建议 Amazon DataZone AI recommendations 预览版,无需共享基础数据的 Amazon Clean Rooms ML 预览版。