MLMs之Claude:Claude 3.5 Sonnet的简介、安装和使用方法、案例应用之详细攻略
目录
Claude 3.5 Sonnet的简介
2024年6月21日,Claude AI团队重磅发布Claude 3.5 Sonnet。Claude 3.5 Sonnet 是 Claude 3.5 模型家族中的首个版本,旨在提高智能水平,超越竞争对手和之前的模型。
Claude 3.5 Sonnet在广泛的评估中表现出色,超越了竞争对手模型和Claude 3 Opus,成为行业新标杆,同时保持了中端模型Claude 3 Sonnet的速度和成本。
Claude 3.5 Sonnet现已在Claude.ai和Claude iOS应用程序上免费提供,而Claude Pro和Team计划订阅者可以在更高的速率限制下访问。此外,它还通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI提供。该模型的费用为每百万输入标记$3,每百万输出标记$15,具有200K标记的上下文窗口。
官方地址:Introducing Claude 3.5 Sonnet \ Anthropic
1、功能
>> 免费访问:在 Claude.ai 和 iOS 应用上免费提供,Pro 和 Team 订阅者有更高的速率限制。
>> 多平台支持:通过 Anthropic API、Amazon Bedrock 和 Google Cloud’s Vertex AI 提供。
>> 视觉能力:改进图表解释和不完美图像的文本转录。
2、核心技术点
>> 速度提升:运行速度是 Claude 3 Opus 的两倍。
>> 编程能力:在内部评估中解决64%的问题,显著优于 Claude 3 Opus。
>> 新功能:Artifacts 功能,提供实时生成和编辑工作空间。
3、官方文章解读
前沿智能,速度提升2倍
Claude模型家族
Claude 3.5 Sonnet在研究生水平的推理(GPQA)、本科水平的知识(MMLU)和编码能力(HumanEval)方面设立了新的行业基准。它在理解细微差别、幽默和复杂指令方面表现出显著改进,并且在以自然、亲切的语气撰写高质量内容方面表现出色。
Claude 3.5 Sonnet的运行速度是Claude 3 Opus的两倍。这一性能提升结合成本效益,使Claude 3.5 Sonnet成为处理复杂任务(如上下文敏感的客户支持和多步骤工作流程协调)的理想选择。
在内部的代理编码评估中,Claude 3.5 Sonnet解决了64%的问题,超越了解决38%问题的Claude 3 Opus。我们的评估测试了模型在给定自然语言描述的期望改进情况下,修复错误或添加功能到开源代码库的能力。通过指示和提供相关工具,Claude 3.5 Sonnet能够独立编写、编辑和执行代码,具有复杂的推理和故障排除能力。它可以轻松处理代码转换,使其在更新遗留应用程序和迁移代码库方面特别有效。
Claude 3.5 Sonnet基准测试
最先进的视觉
Claude 3.5 Sonnet是我们迄今为止最强大的视觉模型,在标准视觉基准测试中超越了Claude 3 Opus。这些显著的改进在需要视觉推理的任务中最为明显,如解释图表和图形。Claude 3.5 Sonnet还可以准确地从不完美的图像中转录文本,这在零售、物流和金融服务中至关重要,因为AI可以从图像、图形或插图中获取比单纯文本更多的见解。
Claude 3.5 Sonnet视觉评估
Artifacts——使用Claude的新方式
今天,我们还在Claude.ai上引入了一项新功能Artifacts,扩展了用户与Claude互动的方式。当用户要求Claude生成代码片段、文本文档或网站设计等内容时,这些Artifacts会出现在对话旁边的专用窗口中。这创造了一个动态工作空间,用户可以实时查看、编辑和基于Claude的创作进行构建,无缝整合AI生成的内容到他们的项目和工作流程中。
这项预览功能标志着Claude从对话式AI向协作工作环境的演变。这只是Claude.ai更广阔愿景的开始,不久将扩展支持团队协作。在不久的将来,团队——甚至整个组织——将能够在一个共享空间中安全地集中他们的知识、文档和正在进行的工作,Claude将作为按需的团队成员提供支持。
安全和隐私的承诺
我们的模型经过严格测试,并经过训练以减少滥用。尽管Claude 3.5 Sonnet的智能水平有所提升,我们的红队评估结果表明Claude 3.5 Sonnet仍保持在ASL-2。更多详细信息可以在模型卡附录中找到。
作为我们安全和透明度承诺的一部分,我们邀请了外部专家测试和完善该最新模型中的安全机制。我们最近向英国人工智能安全研究所(UK AISI)提供了Claude 3.5 Sonnet进行部署前的安全评估。英国AISI完成了3.5 Sonnet的测试,并根据今年早些时候宣布的英美AISI合作备忘录,将结果分享给了美国人工智能安全研究所(US AISI)。
我们整合了外部主题专家的政策反馈,以确保我们的评估是稳健的,并考虑到了滥用的新趋势。这种参与帮助我们的团队扩大了评估3.5 Sonnet应对各种滥用类型的能力。例如,我们使用来自Thorn的儿童安全专家的反馈来更新我们的分类器并微调我们的模型。
指导我们AI模型开发的核心宪法原则之一是隐私。我们不会在没有用户明确许可的情况下使用用户提交的数据来训练我们的生成模型。迄今为止,我们尚未使用任何客户或用户提交的数据来训练我们的生成模型。
即将推出
我们的目标是每隔几个月大幅改善智能、速度和成本之间的权衡曲线。为了完成Claude 3.5模型家族,我们将在今年晚些时候发布Claude 3.5 Haiku和Claude 3.5 Opus。
除了开发下一代模型家族外,我们还在开发新模态和功能,以支持更多的业务用例,包括与企业应用程序的集成。我们的团队还在探索如Memory等功能,这将使Claude能够记住用户指定的偏好和互动历史,使他们的体验更加个性化和高效。
我们不断致力于改进Claude,并热爱听取用户的反馈。您可以在产品中直接提交对Claude 3.5 Sonnet的反馈,以告知我们的开发路线图,帮助我们的团队改善您的体验。我们期待看到您与Claude一起构建、创造和发现的成果。
Claude 3.5 Sonnet的安装和使用方法
1、安装
等待开源中……
2、使用方法
在线地址:App unavailable \ Anthropic
对话聊天功能
Artifacts功能
Claude 3.5 Sonnet的案例应用
持续更新中……