国产首款视觉理解能力模型-Claude Code测评

前言

近期,火山引擎发布了豆包编程相关模型:Doubao-Seed-Code。
按照介绍推文来看,Doubao-Seed-Code是国内首个具备视觉理解能力的编程模型,可参考手绘稿、UI设计封面或给予目标网站的配色等,自主完成样式修复和Bug修复,大幅提升前端开发效率。除此之外,原生支持 256K 长上下文, 轻松处理长代码文件、多模块依赖等复杂场景,实现端到端自主编程,全栈开发友好,前端能力突出。

在国内市场中,DeepSeek V3.1、Kimi K2、GLM 4.6、MiniMax M2 等 Coding 模型均不具备视觉理解能力,或需要依赖MCP实现,将图片转化成语义描述供模型理解,过程中信息折损会很大,效果远不及原生VLM能力;

一个强大的知识大脑加上可理解的视觉神经,回答或许可以不再是盲盒式地自我输出。

嗯,这对于在工作中日常和产品经理battle或想工作增效的开发人员来说是一个不可多得的"帮手",也因时常关注国内市场的大模型更新状态,所以这段时间闲暇之余对Doubao-Seed-Code进行了一些测试。
安装使用

看了介绍,我在Windows 11 安装了Claud Code,对底层调用模型进行更换,无需集成环境或其他MCP,相对于测评来说也比较方便。

首先在火山方舟上,开通这个模型的API Key。如果只是想轻量级体验的话,也可以通过火山引擎体验中心,选择Doubao-Seed-Code。

安装Calude Code

基础环境要求:

  • 安装Node.js 18+
  • 安装Git for windows
  1. 就这么简单!安装完基础环境在命令行界面(WIN + R ——不用我教吧),执行以下命令安装。
npm install -g @anthropic-ai/claude-code
  1. 安装结束后,执行以下命令查看安装结果。
claude --version

使用PowerShell配置环境变量

完场Claude Code安装后,配置以下环境变量。

  1. 在PowerShell中执行以下命令,设置环境变量。
# 去平台复制一下自己的api Key,其他不变
setx ANTHROPIC_AUTH_TOKEN <YOUR ARK_API_KEY>
setx ANTHROPIC_BASE_URL https://ark.cn-beijing.volces.com/api/coding
setx ANTHROPIC_MODEL doubao-seed-code-preview-latest
  1. 在新的PowerShell窗口执行以下命令,检查环境变量是否生效。
echo $env:ANTHROPIC_AUTH_TOKEN
echo $env:ANTHROPIC_BASE_URL
echo $env:ANTHROPIC_MODEL

使用Claude Code

启动Claude Code:进入项目目录,执行claude命令,即可开始使用Claude Code。

# 进入你自己的项目目录
cd my-project
# 启动Claude-Code
claude

模型状态验证:输入/status确认模型状态
Model后面跟着“doubao-seed-code-preview-latest”就是成功接上了!

功能测评

视觉理解能力

首先先测试一下模型的视觉理解能力,毕竟都这么宣传了,指定有它的优势之处。我的想法是:给它一个前端页面需求的手绘稿,然后参考某个网站的截图配色,生成对应的前端代码。
手绘稿:

参考苹果官网截图:
在这里插入图片描述

prompt:@AIlearning.jpg @mytheme2.png 我需要生成一个前端页面,为了展示在线学习网站的错题展示页面,主要以康奈尔笔记法结构展示,同时旁边有一个AI小助手供学习者提问。具体布局请参考我给出的手绘稿,网站的配色请参考我给出的网站截图。
在这里插入图片描述

第一次生成的效果就还可以,结构分布上和我的手绘稿差不多,配色也完美参考了我上传的网站截图配色,因此我没有做二次的prompt调整。只是在一些细节问题上,需要二次去页面上的内容作细化调整。在页面上,它自己生成了一些数学公式,但是却没有正常显示。针对这个问题我对它提出了疑问。(写代码就像聊天一样!( •̀ ω •́ )y)
在这里插入图片描述

改进后,就能正常显示数学公式,只不过加载的时候有一点点慢。
在这里插入图片描述

工作协助式编程

我在日常工作中,会有想到一些协助日常工作的工具,比如说会议备忘录、事件轻重缓急页面展示,或者弄一个摄证王的专属考试倒计时的可视化日历。那这次我就做一个工作备忘录。

prompt:用HTML写一个圣诞主题色的工作备忘录
在这里插入图片描述

第一次生成的页面效果还是一般,通过微调prompt,尝试对其增加更多的提示要求。
在这里插入图片描述

在这里插入图片描述

模型支持上下文,用@方法引用要参考的图片

第二次prompt:@mytheme.png 结合这张图片的风格再次修改

在这里插入图片描述

在这里插入图片描述

再次生成的效果比之前更顺眼了,弱化组件线条感,配色也更好看一些,同时也保留了圣诞元素。
在这里插入图片描述

在这里插入图片描述

兴趣便利可视化

基金作为我的日常兴趣爱好项,俺正好也可以利用这个模型写一个基金收益模拟器。

prompt:用HTML写一个基金定投计划以及收益率监控,提示加仓止盈点

这次我没有参考任何配色,仅仅让其自动生成对应的页面,我对其审美打个84分。如果还有时间的话,我还可以考虑加入爬虫or其他监控程序,每天自动跟踪最新基金净值,当然这可以放在后续完善工作进行。

在这里插入图片描述

小游戏可视化

我看有其他的大佬们完成了小游戏的测评,那么我这次也尝试实现一个经典款的游戏——愤怒的小鸟。
prompt:用HTML制作一款经典游戏“愤怒的小鸟”


在这里插入图片描述

暂时无法在飞书文档外展示此内容

第一次生成后,不依赖任何组件,在页面上仅仅只是通过鼠标的拖拽,就可以发射小鸟,完美实现了基本的游戏玩法。那么我将恶趣味一下,将小鸟换成老鼠,看看以它自己的审美会生成什么。

prompt:是Angry Bird游戏哦。同时把鸟换成老鼠看看,并命名为angry-mice

在这里插入图片描述

在这里插入图片描述

嗯,我感觉这只老鼠好像比小鸟还好看一些。

总结

总体测试下来,我对效果还是比较满意的。在视觉理解能力和编程能力上,能够基本满足我的prompt要求,生成的代码可以直接运行查看。但如何更好地优化可视化界面,完成人类与计算机之间的交互工作,还是得慢慢针对性调整与探索。希望国产大模型越做越好。

另外值得一提的是,目前它的调用价格很便宜,现在有一个 Coding Plan活动,可以 API 包月。首月只要9.9元,强烈推荐一下。

在这里插入图片描述

Claude Code 提供了灵活的模型切换功能,允许用户根据任务需求在不同的模型之间进行选择。例如,用户可以在即时响应模式和扩展思考模式之间切换,以适应不同类型的任务需求[^2]。以下是具体的切换方法: ### 切换模型的方法 1. **通过命令行参数切换模型** 在使用 `claude-code` 命令时,可以通过添加 `--model` 参数来指定所需的模型。例如,若要使用 `claude-3-5-sonnet` 模型,可以执行以下命令: ```bash claude-code --model claude-3-5-sonnet ``` 同理,若要切换到 `claude-3-opus` 模型,可以执行: ```bash claude-code --model claude-3-opus ``` 2. **在交互式会话中切换模型** 如果你已经进入 `claude-code` 的交互式会话界面,可以通过输入特定指令来切换模型。例如,输入以下指令即可切换到 `claude-3-7-sonnet` 模型: ``` /switch-model claude-3-7-sonnet ``` 这种方式适合在对话过程中根据任务复杂度动态调整模型,以获得更高效的推理能力。 3. **配置默认模型(适用于长期使用)** 如果希望将某个模型设为默认选项,可以在配置文件中进行设置。例如,在 `~/.claude/config.json` 文件中添加如下内容: ```json { "default_model": "claude-3-5-sonnet" } ``` 保存后,`claude-code` 将默认使用指定的模型,无需每次手动切换。 4. **在 Windows 上切换模型** 对于 Windows 用户,可以在命令行工具(如 Windows Terminal)中使用与 Linux/macOS 相同的命令进行模型切换。例如: ```bash claude-code --model claude-3-opus ``` 这种方式无需依赖 WSL 或双系统环境,即可在本地直接运行并切换模型[^4]。 5. **对接第三方模型(如智谱 AI)** 如果希望使用第三方模型(如智谱大模型),可以通过设置环境变量来实现。首先获取智谱平台的 API Key,然后设置如下环境变量: ```bash export ANTHROPIC_AUTH_TOKEN=your_api_key export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic ``` 设置完成后,`claude-code` 将使用指定的第三方模型进行推理[^3]。 ### 总结 通过上述方法,用户可以根据具体任务需求在 `claude-code` 中灵活切换不同模型,从而优化响应速度和推理能力。例如,对于需要快速响应的任务,可以选择 `claude-3-sonnet` 或 `claude-3-7-sonnet`;而对于复杂推理任务,则可以切换到 `claude-3-5-sonnet` 或 `claude-3-opus`。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

袁袁袁袁满

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值