今天,Anthropic最新推出Claude 3.5 Sonnet模型在Amazon Bedrock正式上线。升级版Claude 3.5 Sonnet获得了一项革命性的新技能:能够像人类一样操作电脑。根据 Anthropic介绍,该模型各项能力均超越之前版本,实现了全面提升——尤其在代码方面,进一步巩固其行业领先地位。
Claude 3.5 Sonnet在业界基准测试中表现卓越,在SWE-bench Verified编码测试的得分由33%跃升至49%,超越所有目前公开可用的模型。
在TAU-bench(评估模型灵活运用工具和API综合能力的基准测试)中,其零售领域得分从62.6% 提高到69.2%,航空领域从36.0%提高到46.0%。性能全面提升的同时,Claude 3.5 Sonnet的成本与之前版本保持一致。
Claude 3.5 Sonnet新增的“计算机使用”功能现已在Amazon Bedrock上线公测版,赋予使用者引导Claude模拟人类行为进行屏幕观察、鼠标移动、点击以及文本输入等操作的能力。由于这项技术仍处于早期阶段,建议用户从尝试低风险任务开始,逐步探索这项强大的新功能。
Claude 3.5 Sonnet现已在美国西部(俄勒冈州)地区的Amazon Bedrock中上线。您可阅读Amazon News发布博客和Amazon Bedrock文档了解详细信息。
扫码获取实验链接,在PC端打开即刻开始体验大模型魔力。无需成本,12小时内有效。实验手册还很详实哦!☁上LLM,let's go!
星标不迷路,开发更极速!
关注后记得星标「亚马逊云开发者」
听说,点完下面4个按钮
就不会碰到bug了!