全面超越GPT-4,Claude 3终于来了,支持百万token

点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

4926fac892c20431141a35e08a0cdc2f.gif

0a5fc5d372b417b1a69d0b6c8a9c00b6.gif

公众号ID计算机视觉研究院

学习群扫码在主页获取加入方式

计算机视觉研究院专栏

Column of Computer Vision Institute

性能比 GPT-4 强很多。

31d6ae6835824a080ccc745c42c7eb00.gif

39d175e4a03a71171ee38be528405d70.png

3d195963677ca87cae91d86cacecdf4f.png

b30a436a71e78a3596ce61074bcac201.png

454c9be5249674f09e6017e4e9c811d4.png

aaf43a7306965ac480d0d3d1d776f8a3.png

97c58bb03eaa1108848031e0b44fd864.png

9208c3e6d8e5f48560b9c7805123c5f0.png

d939bfd1bcac8fe44a13878be5bfdb3b.png

不过,也有人表示,在实际体验方面,Claude 3 并没有彻底击败 GPT-4。

062ec52322f52e96555ae93b5680b17c.png

Claude 3 系列模型

ad4b8ecb631bf1428f22a24d8c7dfd67.png

189eff158d1af75c8a0b78830392cd79.png

0584d22cb3eba414ba1f8d8bc420eb7d.png

a7cded3742503a6575c27ca6e8b73ef7.png

be261bdd7bf7202384838bc87c2e3ee9.png

df98591e796bbb71e134bea85dd31757.png

b0b2b785853467fc584dc7e3d028bb77.png

58e6e4c228e0e867be04f35826ba9008.png

ff1d749e54be0923aa6081680530e8ba.png

22c0bb536c3a7654388495af69a32fb6.png

ee1aa65c26f064a05899ae0b4a0a5ee8.png

01d5cf062d9942c0b7b758e0b9e08545.png

54681106bad427a5f731d7ea03cb5d6f.png

5518bc7e15f84d602f633208a6d37864.png

6b66696465a10d1b134e568df15310f1.png

9939e07adc5d652d4391cf6513bf97c4.png

21edc4c8994e19bffdc348f4036c7f13.png

39c9975f264aefd38dec78d0d28dddf3.png

报告地址:https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf

5d92a9a89ebb9fd2e4fe637d3318fde0.png

9a82ab613c15f92878df34117b161ca8.png

bae6220516d691199caa22ef349f6be8.png

3eedd994298c2c05eb5b0ad94e73b6fd.png

e8184de386acfc65c0fc39d53600e4b1.png

cd805173bfd1b5a7219acb64347d841e.png

e74ff6ce0820fd83876541b81b178e98.png

27e1928c3488ff8862b9fcc6ca61880a.png

他认为,真正能够把模型区分开的是 MATH 和 GPQA,这些超级棘手的问题是 AI 模型下一步应该瞄准的目标。

1732a1a8abeb16aad2372c2af08930e9.png

与 Claude 之前的模型相比,改进比较大的领域是金融和医学。

34bb8419fd6ca97c9dfba98475780b61.png

视觉方面,Claude 3 表现出的视觉 OCR 能力让人看到了它在数据收集方面的巨大潜力。

fc371d2bf79dd087bda851bf078dae0d.png

此外,他还发现了其他一些趋势:

ede9ea54ee9f2860532d08259d5e4228.png

3592865a584919cc8009342728ff0a1a.png

从目前的评测基准和体验看来,Claude 3 在智能水平、多模态能力和速度上都取得了长足的进步。随着新系列模型的进一步优化和应用,我们或许将看到更加多元化的大模型生态。

537220a6fafa78ed291b82ad38a7724d.gif

END

001afa012b474c1794402aef598fa8a5.gif

e3fd7ec299ca0f649c69631acef2832c.gif

转载请联系本公众号获得授权

52aa668c4d8d1882ddb6391b155ecbd3.gif

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

65de024cb15e7cd8300cea4413b04b5a.png

 往期推荐 

🔗

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值