Anthropic推出Claude3：大模型在数学、编码和视觉等方面建立新基准

猛码Memmat

已于 2024-03-13 21:54:29 修改

阅读量631

点赞数 7

分类专栏： rob-agent / aigc 文章标签：人工智能大模型 openai anthropic

于 2024-03-05 10:18:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JishuFengyang/article/details/136470858

版权

rob-agent / aigc 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

文章目录

1. product
2. Main
3. My thoughts
Reference

Claude 3 在推理、数学、编码、多语言理解和视觉方面，全面超越GPT-4在内的所有大模型，重新树立大模型基准。

1. product

https://claude.ai/

在这里插入图片描述

在这里插入图片描述

2. Main

2.1 核心能力

拥有前所未有的长语境和记忆能力，所有型号支持 100 万 token 上下文；在此基础上，Claude 3 Opus 不仅实现了接近完美的召回率，准确率超过 99%。
全新的视觉多模态能力，能够处理各种模态，包括照片、图表和各类流程图、PDF 和 PPT 等。
可以遵循复杂的多步骤指令，并擅长以 Json 格式生成流程的结构化输出。
更智能、更快、更安全

Anthropic 宣称将在未来对该系列不断更新迭代，让用户可以为其特定应用选择智能、速度和成本的最佳平衡。

2.2 打榜表现

在这里插入图片描述

在这里插入图片描述

2.3 缺点

相对于ChatGPT，目前Claude的全系产品均不能直接链接互联网查询资料。可能没有互联网巨头的加持。
国内暂不能使用，注册需要外网及国外手机号码验证，收费（应该没开源）。
多语言推理能力的不完备，在处理小语种时性能较不稳定。
多模态能力方面的准确性有待提高，Claude模型有时可能生成关于图像的不准确信息和描述。性能有时也会在处理小图像或低分辨率图像时降低。
论文中提到：随着时间的推移，决定Claude“个性”和能力的数据和影响因素变得相当复杂。在简单可自动化的方式中平衡这些因素，跟踪它们，以及一般减少训练Claude的复杂性，仍然是我们的关键研究问题。

大模型，还只是小部分人的狂欢。ChatGPT的更大的贡献可能是AI技术的普及化。

2.4 应用方向、发展及合作

Anthropic在Claude 3的发布博客中介绍了三款模型的潜在应用方向，带着浓浓的ToB商业化气息。

Claude 3 Opus：任务自动化，跨 API 和数据库规划和执行复杂的操作、交互式编码；研发，研究回顾、集思广益和假设生成、药物发现；策略，图表、财务和市场趋势的高级分析、预测。

Claude 3 Sonnet：数据处理，RAG 或对大量知识的搜索和检索；销售，产品推荐、预测、定向营销；节省时间的任务，代码生成、质量控制、从图像中解析文本。

Claude 3 Haiku：客户互动，实时互动、翻译中快速、准确的支持；内容审核，捕捉危险行为或客户请求；节省成本的任务，优化物流、库存管理、从非结构化数据中提取知识。

外界一直认为Anthropic是一家有着重度ToB基因的公司。

Anthropic在C轮融资中，引入了Google、Salesforce、Zoom等技术和服务市场上的ToB科技巨头，这些合作伙伴对AI公司的诉求必然是将先进的AI技术集成到自己的产品和服务中，以提高效率、创新能力和竞争力。

此外，Anthropic已经与Zoom开展合作，旨在“构建以可靠性、生产力和安全性为中心的面向客户的AI产品”，也清晰地表明了公司的B2B基因。这种合作通常涉及开发能够为企业提供具体价值的解决方案，如改善客户服务、自动化工作流程或提供决策支持等。

Anthropic还与波士顿咨询集团（BCG）合作，旨在将负责任的生成式AI技术引入到企业客户中。通过这一合作，BCG的客户可以直接利用Anthropic的AI系统，包括其最先进的模型Claude 2，这些系统专注于可靠性、可解释性和可控性。

目前，Anthropic声称已拥有多个来自不同行业（包括医疗保健、人力资源和教育等）的客户。

在企业服务和ToB市场上，虽然OpenAI也推出了ChatGPT Enterprise版以及企业的API接口，但相对于Anthropic与企业的深度合作，则ToB属性轻得多。

从这次Claude 3的中提及的很多重点也可以看出，Anthropic希望在商业化方面，走出一条与OpenAI不同的道路。

3. My thoughts

大模型的出现不断刷新着人们对于机器智能的认知。国内人工智能研究实力和国产大模型性能并不弱于国外，但为什么国内相关模型在国内的热度明显低于国外呢？是不属于同一竞争赛道吗？还是国内科研和技术派的注意力被自媒体带跑偏了？

在这里插入图片描述

Reference

https://www.anthropic.com/news/claude-3-family

https://mp.weixin.qq.com/s/PCGnLQx-cJ1Y0GKX1sjLPw

https://mp.weixin.qq.com/s/qEBNNtZoI_vHWRvftGii6A

关注

7
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

猛码Memmat CSDN认证博客专家 CSDN认证企业博客

码龄5年

225: 原创

4951: 周排名

1万+: 总排名

23万+: 访问

: 等级

3736: 积分

7244: 粉丝

1195: 获赞

149: 评论

1506: 收藏

私信

关注

热门文章

分类专栏

Memmat 付费 37篇
prompt 7篇
vision / segmentation 21篇
main.dl 17篇
detection 6篇
rec sys 5篇
nlp 5篇
init.dl 15篇
rob-agent / aigc 19篇
ml 7篇
library / tool 19篇
environment 14篇
master 28篇
code 24篇

最新评论

Tutorial：Deep Learning for Remote Sensing Data
猛码Memmat: 半监督域适应微调框架Colabator。论文预印本链接：https://arxiv.org/pdf/2406.07966 仓库链接：https://github.com/cnyvfang/CORUN-Colabator
Tutorial：Deep Learning for Remote Sensing Data
猛码Memmat: idea：More accurate and personalised weather forecasts ？
【AI TIME】具身智能灵巧手是怎样练成的？
猛码Memmat: openly accessible journal（OA期刊）
启发式算法python示例：元启发式算法 Metaheuristic Algorithm
猛码Memmat: 在处理大量视频时，采用检索增强生成（RAG）技术是一个有效的策略。首先，需要对视频进行基本分析，包括场景识别、语音转文本、物体识别等。根据场景变化、话题转换或时间段，将视频切分成更小的片段。这些片段可以是短视频、关键帧序列或转录文本。可以使用文本摘要、关键帧、特征向量等方式来表达视频片段的内容。通过自然语言描述或标签，对片段进行进一步注释，便于检索。将切分后的片段存入一个知识库。在用户提问时，从知识库中检索相关片段，并结合生成模型生成回答。在医疗领域，视频内容可能涉及复杂的医学术语、诊断影像等，因此需要专业的知识库和模型进行支持。特殊的隐私和数据安全要求也需要考虑。通过这样的步骤，可以有效地对大量视频进行管理和问答。
启发式算法python示例：元启发式算法 Metaheuristic Algorithm
猛码Memmat: CRUD是四个基本操作的缩写，它们分别是Create（创建）、Read（读取）、Update（更新）和Delete（删除）。这四个操作是数据库管理和软件开发中非常基础且常见的功能，几乎涵盖了数据操作的所有基本需求。 Create（创建）：这个操作通常用于在数据库中添加新的记录或条目。在Web应用中，这通常意味着用户提交了一个表单，表单中的数据被收集并存储到数据库中。例如，在一个用户管理系统中，用户可以通过填写表单来创建一个新的用户账户。 Read（读取）：这个操作用于从数据库中检索数据，以便在应用程序中展示或处理。读取操作可以根据不同的需求以不同的方式执行，比如查询所有记录、查询特定条件的记录、分页查询等。在Web应用中，这通常涉及到显示数据列表、详情页面等。 Update（更新）：当数据需要修改时，就会使用更新操作。这可以包括更改记录的字段值、更新状态或任何其他需要修改的数据。在Web应用中，用户可能会提交一个表单来更新他们的个人信息，比如电子邮件地址或密码。 Delete（删除）：这个操作用于从数据库中移除不再需要的记录。删除操作需要谨慎处理，以确保不会意外删除重要数据。在Web应用中，用户可能会请求删除他们自己的账户或某些数据项。 CRUD操作是大多数数据库和Web应用程序的核心功能。了解并熟练掌握这些操作是进行数据库管理和Web开发的基础。随着技术的发展，CRUD操作也可以通过各种框架和工具来自动化和简化，从而提高开发效率和质量。

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

猛码Memmat 欢迎支持，随缘打赏 ~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。