尽管各大 LLM 厂商百花齐放,OpenAI 的 GPT 系列依然一骑绝尘!
虽然 OpenAI 官网已将 GPT4o 开发给免费用户使用,受限于网络原因,国内很多小伙伴依然没有用上免费纯正的 GPT4o~
即便克服了网络障碍,免费用户每3小时也只能使用 GPT-4o 10次。
今天看到一个项目-Chatbot Arena
,可以无限白嫖 GPT-4o,分享给大家!
1. Chatbot Arena 简介
Chatbot Arena 是伯克利的LMSYS组织在 2023 年就搭建的一套评测各大 LLM 的平台,简称大模型竞技场
。
这个组织的另外两项工作也非常有影响力:
- LlaMa 系列开源大语言模型,最新版已到了 LlaMa3.1,还没体验过的小伙伴可以参考:全网刷屏的 LLaMa3.1 还没用上?2分钟带你尝个鲜
- Vicuna 系列开源多模态大模型,底座的大语言模型也是用的 LlaMa。
相对而言,Chatbot Arena 影响力不如上面两项。那么,Chatbot Arena 到底干了啥?
一个基于人类偏好评估 LLM 的开放平台。其采用成对比较方法,利用不同用户的输入,积累用户对不同 LLM 回答偏好的投票。
结果表明,众包投票与专家投票高度一致,因此 Chatbot Arena 的可信度非常高,一跃成为最受引用的 LLM 排行榜之一,被领先的 LLM 开发人员和公司广泛引用。
2. 大模型排行榜
主页选择 Leaderboard
,可以看到最新的大模型排行榜。ChatGPT-4o 依旧遥遥领先,确实强。
3. 大模型 PK
主页选择 Arena(side-by-side)
,可以任意选择两个大模型进行 PK,哪个好用选哪个~
4. 白嫖 GPT-4o
当然,对于绝大部分用户而言,根本不关心排行榜,就是想白嫖下 GPT-4o 对吧。
主页选择 Direct Chat
,尽情开启 GPT-4o 的白嫖之旅吧。
不过,高峰期时,白嫖 chatgpt-4o-latest
可能会遇到MODEL_HOURLY_LIMIT (chatgpt-4o-latest): 2000
。
那就换一个 GPT-4o 的版本试试吧,毕竟榜一大哥被薅的太狠,官方服务器怕是扛不住吧~
写在最后
今天给大家安利了 LLM 界的"奥林匹克" - Chatbot Arena!
不仅能看到最新的 LLM 排行榜,还能亲自上阵让两个 LLM 互掐,看谁更厉害。
不过这些都不重要,最重要的是 - 它为我们白嫖 GPT-4o,提供了一种可能。
如果本文对你有帮助,不妨点个免费的赞和收藏备用。