2025年2月深度实测!DeepSeek、OpenAI o1、Gemini打造爆款应用及对比

我在网上看到了关于DeepSeek R1的各种说法,这是一个开源模型,其能力即便不比OpenAI o1等付费模型强,也与之相当:

在这里插入图片描述

由于我在日常工作中广泛使用这些人工智能模型(使用Cursor AI),我决定看看哪种模型最适合我。

在进行了200次Cursor请求后,我将分享我的实验结果。
在这里插入图片描述

一、实验设置

我从lmarena排行榜上挑选了前两名的模型,即DeepSeek R1和OpenAI的o1:

以及竞争对手——Gemini-Exp-1206……

我设计了三个实际的编码挑战来测试每个模型的能力:

情绪追踪网络应用程序

  • 基于日历的情绪记录
  • 可视化情绪追踪
  • 图表数据可视化

在这里插入图片描述

由o1设计的情绪追踪器

随机食谱生成器

  • 与MealDB API集成
  • 类别过滤
  • 收藏管理
    在这里插入图片描述

由DeepSeek R1设计的食谱生成器

“抓鼹鼠”游戏

  • 实时动画
  • 音效
  • 难度递进
    在这里插入图片描述

由Gemini设计的“抓鼹鼠”游戏

二、如何测试每个模型

我对这三个挑战都采用了完全相同的流程:

  1. 编写小型需求文档
    我列出了每个项目应包含内容的简要清单,比如“使用日历库”“使用本地存储来存储数据”或“从外部API获取数据”。
  2. 向人工智能索要完整代码
    我向模型提出需求,然后等待生成代码。如果代码有漏洞或缺少某些功能,我会提供具体反馈(比如“情绪的颜色编码有问题”等),直到代码能够正常运行。
  3. 对结果进行评分
    一旦应用程序运行起来,我就会根据我的检查清单对其进行测试。主要功能是否可用?代码结构是否整洁?从用户角度看是否良好?我会给每个模型一个最终评级。
  4. 进行比较
    在使用这三个模型完成了所有三个应用程序后,我收集了我的笔记并进行了整理。

下图是代码生成的流程。
在这里插入图片描述

以下是一个示例产品需求文档(PRD)的样子:

---
name: "Mood Tracker"
about: "Modern mood tracking web app with data visualization"
date_created: "2025-01-26"
project_name: "MoodTracker"
tech_stack: ["NextJS 15", "TypeScript", "Shadcn", "Tailwind CSS", "Chart.js", "date-fns"]
version: "1.3"
---

# 🎯 Mood Tracker PRD

A modern web application for logging daily moods and visualizing emotional trends with charts.

---

## 1. **Success Criteria**

1. **Core Functionality**
   -
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

硅基创想家

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值