大模型的第一个杀手级应用场景出来了

大家终于都意识到大模型首先改变的是软件行业自己,而软件的根基是代码生成。代码生成第一波就是AI辅助开发,这个会是大模型第一个杀手级应用。大家苦苦逼问自己的大模型杀手级应用,为什么会是辅助编程,这里说下什么:

  1. 必须吃狗粮,颠覆性技术连自己的领域都颠覆不了,那还叫啥颠覆性技术。

  2. 允许出错。AI辅助开发具有良好的容错率,允许出错,这个相当重要,也是当前大模型在其他领域目前难以落地的根本原因。

  3. 市场规模大,整个软件市场是千亿到万亿规模的。

  4. 初始客群接受度高。AI辅助编程的第一波客群程序员,技术人员群体规模大,对新技术敏感,接受度高,github copilot 这种处于非常初级的产品就获得百万付费用户(月流水至少两亿)。

这也是为什么我一直致力于代码生成的工作,并且愿景比 Cursor这类大的多,不只是个IDE,这个我们后面再说。

AI辅助编程流派

先说下当前AI辅助编程的流派:

1. 命令行交互式,代表为 auto-coder.chat,aider,mentat,plandex 等。

2. IDE 集成式,代表为 cursor,codium 等,此外还有插件子派,比如 auto-coder.chat, claude-dev 等。

3. Web IDE 为主,代表为 devin, phind(这个比较简陋),以及在 git 内置的一些编程辅助工具。

这里没有提及github copilot 等类似产品,是因为我认为他们不属于AI编程…hmmm… 我只能说是更智能的代码补全工具。

目前真正能落地是两个,一个是命令行交互,一个是IDE 集成。 今天会分别以 auto-coder.chat 和 cursor 来作为两派的代表来对比。

IDE派的优点:

  1. 对于程序员而言,大家熟悉度更高,门槛更低。

  2. 可以在 IDE 交互上做到极致的交互体验,所见即所得。

  3. 开箱即用,下载IDE,打开即可使用。

  4. IDE 提供了一些交互button,比如运行项目,debug项目,这个是其他工具很难替代的。

IDE派的缺点:

  1. Cursor为了追求极致的体验,没有用插件的方式,而是直接二次开发,导致IDE绑定。

  2. 适合人机交互,但难以自动化。

  3. 交互界面在复杂场景下,容易繁琐,想设计好不容易,用户也有一定的学习成本。大家用compser 这种就会发现这个问题。

另外,必须提的一点:大家觉得IDE 交互简单其实是因为大家已经前置学习了 IDE(从你接触编程开始的第一件事就是学习IDE)。IDE 就是图片界的Photoshop 是一款专业软件,实际门槛并不低(但因为前面的原因感觉门槛低)。

命令行流派的优点:

  1. 兼容所有IDE(所有IDE都有内置terminal),甚至不需要IDE

  2. 对于纯萌新而言,实际入门门槛比IDE低(参考前面我特别提醒的点)

  3. 交互一旦学习了以后,效率是远高于IDE的(这点和历史一样)

比如,当你看到一个github 项目,三步即可添加新功能特性:

  1. clone 项目到本地

  2. 进入目录运行 auto-coder.chat

  3. /coding <描述你的需求>

会比 IDE 更轻松。

命令行流派的缺点:

  1. 需要用户适当记住一些指令,比如 /coding /chat 等。但是随着大模型越来越强,用户可能只需要一两个指令即可。

  2. 很多人对命令行略显恐惧。但实际上现在的命令行非常强大,不输编辑器(唯一的缺点是对鼠标支持不好)

  3. 对于有代码阅读需求的,或者需要手工做修改,或者要做代码debug,那么还是需要 IDE 配合。

流派融合

看完了上面的比对,你肯定在纠结,那到底应该用哪个呢?亦或者你心里早就有谱了,我就是用IDE,或者我就是用 Terminal。Naive! 成年人需要做选择题么?成年人应该是:我都要!

所以我今天特意发了这么一个文案:

免费版 cursor + auto-coder.chat = cursor pro``付费版 cursor + auto-coder.chat = cursor pro NEXT``   

其他你喜欢的IDE工具:

Vscode + github copilot/comate/灵码  + auto-coder.chat = cursor pro``Idea + github copilot/comate/灵码 auto-coder.chat = cursor pro``Vim + auto-coder.chat = cursor pro

然后我发现也有不少用户已经这么组合来用了,果然,“你再快能快的过用户”?

为什么要这么组合使用呢?因为 1+1 大于2么,各自弥补对方的缺点,提升自己优点。我推荐 cursor + auto-coder.chat。

cursor 可以作为 GitHub copilot 的更好的替代品。 而auto-coder.chat 则有更好的多文件编辑能力,算是更好的 composer。

Cursor 深度剖析,为什么是极致版的 github copilot

重度使用了 cursor 两天。他的迭代路径也很清晰,从早期的copilot (tab tab) 到支持可以参考多个文件针对 “单文件自动修改和合并”(apply)。其中第二个能力是当前 github copilot 没有的,github copilot chat框里的代码没有办法直接合并到文件里,你只能拷贝黏贴。cursor 的单文件修改交互体验做到很极致,那个酷炫的apply 效果很容易勾动程序员的小心脏,但做的再好,也只是一个编辑器辅助功能,程序员很爽,但天花板也很明显,效率提升有限,毕竟还是程序员在手写代码(tab tab) 或者只能针对一个文件做修改(apply)。尽管如此,体验还是吊打 GitHub copilot的。

加上sonnet 3.5 理解能力很强,而且context相对来说比较简单,基本生成的效果相当好。

很多同学看到这,就觉得,很好了呀,为啥不够?代码都能自动写,自动合并了,还有啥可以提升的呀?

注意,实际场景是,当你想添加一个功能需求的时候,你可能需要修改一组相关联的文件,修改多个文件后,你还需要确保他们可以正常的协同工作。这才是最有难度和消耗时间的地方。

程序员会经常说:

1. 哦,我漏了某个地方忘了改了,导致系统错误,

2. 亦或者说,哦 我改了一个地方,结果影响到另外一个地方了。

这是最常见的情况,也是最难,效率最低,也是bug的温床

所以未来cursor的希望,就是他们新推出的composer,composer默认是关闭的,需要你去单独开启(新版本据说已经开启了),估计很多人就没体验到。这个功能让cursor迈向了支持多文件新建,修改和合并。这个是从功能迈向“需求”的关键,可以针对现有代码实现一个完整的功能需求。整体效果也不错。

cusor 里composer 的界面是这样的:

在这里插入图片描述

和原有的功能是相当割裂的,新启动了一套窗口。我实测下来,他还是比较适合新增一些文件,对于比较复杂的文件修改,还是不太行,合并不进去。我估计是因为他们采用的是 wholefile + diff 算法来做的合并,但目前看效果并不理想。这个我会在后面的案例里详细说明。

这个发展历程和我之前想的差不多,之前我说 cursor走了很多“弯路”。auto-coder.chat 从项目之初,就是要走需求驱动,根据需求自动实现多文件新增修改,相当于第一版我们就做了个composer。我们在 Opus 时代就已经发现可以很好的支撑了多文件修改能力了。

总之 cursor 发展是好事,极大的降低了 auto-coder.chat 的布道门槛,增大了行业的蛋糕。

auto-coder.chat 深度剖析,为什么可以作为极致版的 cursor composer

auto-coder.chat 从一开始就是支持“多文件修改”,面向需求的的代码辅助工具。

对于代码补全和简单的代码续写生成亦或者手动编写代码,debug调试等,用户可以搭配 GitHub copilot ,通义灵码,comate或者cursor来完成。

auto-coder.chat 在 cursor 等IDE中的使用也极度简单,比把大象装进冰箱还少一步:

1. 打开IDE terminal, 输入 auto-coder.chat 命令

2. 输入 /coding <描述你的需求>

两步相当于给你带来了真正生产级别的 composer 功能。

来个真实的小案例

昨天我正好想给auto-coder.chat 加上国际化功能。修改之前我们可以看到,所有交互信息都是直接写死在代码里的(英文):

现在我们希望把系统初始化过程中,交互和输出给用户的信息都要支持中英文。基本思路就是,

  1. 新建一个python文件,里面放中英文文本,并且提供 get_message 函数方便外部使用。

  2. 修改所有 chat_auto_coder.py 文件中所以打印信息的部分,采用get_message。

相信很多程序员对这个事都记忆犹新,大量的苦力活,而且还容易错漏,要反复测。

cursor composer 的艰难尝试

我一开始采用 cursor 的 composer 功能来完成。下面是我尝试和他的沟通:

这是新增的文件内容:

这是他修改的文件内容:

很遗憾:

  1. 新增内容的路径没有放对,放到了项目根目录,说明对目录理解还是不够。

  2. 修改的内容,无法合并到原有代码(原有代码大概有两千多行)。

我尝试了三次,你看到是最后一版,依然没有成功。

auto-coder.chat 的手到擒来

就一句话,没有更多:

然后在准确的位置新增了一个文件:

修改了一个已经拥有2000多行代码的文件:

大概修改了十几个地方,从diff 可以看出,没有一处遗漏。

最后实现的效果:

依葫芦画瓢改了其他地方:

顺利实现了我的需求,我昨天也顺利发版了 auto-coder==0.1.165 版本。

一个小总结

  1. 和人比,如果是人去做这件事,虽然没啥难度,但必然是漏了这里,漏了哪里,基本上 auto-coder.chat 几分钟可以搞好的事情,人需要花半天到一天。

  2. 和 cursor composer 比,它没有运行成功,并且它还有繁琐的交互的。而auto-coder.chat 的思想是,快速合并,快速/reivew, 快速 /revert 或者 go on。

auto-coder.chat 不仅仅是 auto-coder.chat

如果你觉得 auto-coder.chat 仅仅是一个命令行工具就Naive了,给大家看一张图:

在这里插入图片描述

auto-coder.chat 只是水上的冰山,我们在下面做了大量工作,从而支持各种形态的辅助编程产品,提供的API接口也支持企业将自动化编程接近自己的 CICD 开发流程中。

此外,我们还提供了最好的编程知识库集成,以及类似 cursor directory 的 auto-coder.chat lib 功能。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

  • 16
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值