宝子们,AI编程的天又被捅破了!就在前天晚上,Claude 3.7 Sonnet 深夜上线,紧接着 Deepseek API 也紧急开放了充值入口。这俩消息一出,AI 圈直接炸开了锅,今天咱就来好好唠唠这俩 “大动作”。
Claude 3.7 Sonnet:混合推理的 “卷王”
Claude 3.7 Sonnet 这次上线,真的是来势汹汹啊。作为 Claude 家族的新成员,它可不是简单的升级,而是直接来了个 “混合推理” 的大招。
普通模式 vs 扩展模式:这货就像个两面派,普通模式下,回答那叫一个迅速流畅,和以前的 Claude 3.5 Sonnet 差不多,但更牛掰了。可一旦切换到扩展模式,那就像变了个人,开始展开思维链,自己推理起来,数学、物理、编程这些复杂任务都不在话下。
API 定价与成本优化:价格方面,Claude 3.7 Sonnet 也算有点良心。每百万输入 3 美刀,每百万输出 15 美刀,最长能输出 128k。而且还有 prompt caching 和 batch processing,能分别节省 90% 和 50% 的成本。开发者还能设置 “思维预算”,精确控制它在问题上花的时间,这自由度简直了。但是价格上跟Deepseek还是有不少距离,毕竟Deepseek价格屠夫不是白叫的,但是比OpenAI好不少了
Deepseek API:开源与充值的 “急先锋”
再说说 Deepseek API,这货也是个 “急先锋”。之前因为服务器资源紧张,暂停了充值,最近终于紧急开放了充值入口。网页版及 App 对话免费使用,无需充值
服务器资源紧张与充值重启:尽管海内外云厂商、运营商和国家级平台都接入了 Deepseek 的模型,但卡顿现象还是存在。Deepseek 官方也是挺拼的,建议大家在凌晨 0:30 到上午 8:30 的空闲时段用 API,这样体验更流畅。充值重启也意味着 Deepseek 要进入技术研发和应用的下一阶段了。
开源周与技术共享:Deepseek 最近还开启了 “开源周”,陆续开源了 5 个代码库。先是针对 Hopper GPU 优化的 FlashMLA,接着是 DeepEP,这可是首个用于 MoE 模型训练和推理的开源 EP 通信库。DeepEP 在节点内部的多卡通信中表现接近带宽上限,节点间通信效率也提升不少。截至发稿,DeepEP 的 Star 量已经达到 4.2k,这受欢迎程度可不是盖的。
Claude 3.7 Sonnet 和 Deepseek API 这俩扛把子,虽然走的路子不一样,但都在 AI 编程领域掀起了波澜。让我们来预测一波,Claude会不会开源呢?
🎁微信搜索【程序猿Mario】,获得更多AI信息,记得关注公众号哦🎁
别忘了点赞👍 + 关注,祝您事事顺心,口袋里的钱比AI 的 token还多~ ——来自[程序猿Mario]的祝福