自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(390)
  • 资源 (2)
  • 问答 (1)
  • 收藏
  • 关注

原创 MLSQL -个人开源项目的成长之路

前言今天看了下项目的first commit log, 发现再过几天,就已经三年整了。commit bbf08489f2e3c58afd584e03b8c9c83d25c63b3bAuthor: WilliamZhu <allwefantasy@gmail.com>Date: Thu Apr 28 15:04:13 2016 +0800open-source versi...

2019-04-23 15:46:06 5687

原创 大模型的第一个杀手级应用场景出来了

大家终于都意识到大模型首先改变的是软件行业自己,而软件的根基是代码生成。代码生成第一波就是AI辅助开发,这个会是大模型第一个杀手级应用。大家苦苦逼问自己的大模型杀手级应用,为什么会是辅助编程,这里说下什么:必须吃狗粮,颠覆性技术连自己的领域都颠覆不了,那还叫啥颠覆性技术。允许出错。AI辅助开发具有良好的容错率,允许出错,这个相当重要,也是当前大模型在其他领域目前难以落地的根本原因。市场规模大,整...

2024-09-09 13:01:55 1113

原创 当你看到一个github 项目后....(auto-coder.chat 最简教程)

???? 克隆项目:git clone <项目地址>???? 进入项目文件夹:cd <项目文件夹>⚙️ 运行 auto-coder.chat:如果尚未安装,执行以下命令:pip install -U auto-coder???? 配置项目类型:编辑配置文件:/conf project_type:py支持 py(Python)、ts(前端),或者语言后缀组合。如果你使用混合语言项目,比如 Ja...

2024-09-08 15:18:36 251

原创 AI辅助编程里的 Atom Group 的概念和使用

背景在我们实际的开发当中,一个需求往往会涉及到多个文件修改,而需求也往往有相似性。举个例子,我经常需要在 auto-coder中需要添加命令行参数,通常是这样的:/coding 添加一个新的命令行参数 --chat_model 默认值为空实际上这个需求涉及到以下文件列表:/Users/allwefantasy/projects/auto-coder/src/autocoder/auto_coder...

2024-09-07 22:28:23 561

原创 简单和大家聊聊nlp2sql 以及 SQL数据分析存在的问题,以及解决方案。

快速过下背景:1. nlp2sql去年大模型一出来,大家就开始搞了,但是目前准确率普遍上不去,导致很难普及。这个技术主要是改变交互,从人讲自然语言需求写SQL改成大模型来理解自然语言,写SQL。2. SQL内置大模型函数支持实现对传统数据分析能力的突破,这个去年应该是我们和 Databricks 搞的比较早,我们可能略早(纯瞎猜),而且底层技术方案可能也完全不一样。这个技术就是补上了SQL 对非...

2024-09-02 11:39:57 534

原创 让你的 terminal 秒变warp 自带自然语言交互buff

背景在实际编程的过程中,你其实会大量使用命令行来完成一些工作。比如写完代码,要启动一个服务,发现服务端口被占用,这个时候你可能想查看这个端口到底被哪个其他服务占用,然后你挠头了,去问问chatgpt 或者 google 怎么查询端口占用。接着一不小心,把 __pycache__ 文件都加到git 里了,你想递归删除一些文件,然后你又挠挠头,去问问chatgpt 或者 google 怎么写删除命令。...

2024-08-28 14:13:19 284

原创 编码效率提升只是提升编码效率?Naive!/老板必看系列

我们知道国内是重业务而不是重技术的,哪怕是技术公司。其实也是能完全理解的,公司首先要的是盈利和存活,长线大家都想,但是条件确实也不太允许。但是目前的思想往往会带来一些陷阱。比如当谈到编码效率的提升,大家往往都是嗤之以鼻。研发们会说:我大部分时间都是在扯皮,编码时间很少。所以提升编码效率价值不大。老板会说:我要的是业务价值,编码效率提升有啥用?来,别急,我们快速梳理下思路。首先我们先看下现在的主流开...

2024-08-22 15:03:07 317

原创 世界上最简单最暴力的 RAG 系统

要搞一个 RAG 系统,hmmm,大模型,向量模型,向量存储这三个是标配,接着呢,为了让效果变得更好, 就要继续加啊加,再来个rerank 模型,提高下精度,向量存储不够,再加个全文检索,做混合多路召回。瞬间把系统复杂度拉满,然后又要开始做资源隔离,做运维了,保证多系统协同工作,高可用 balabala...光把系统搞复杂怎么行?应用也要搞复杂!效果还不高,引入llama_index,这玩意提供...

2024-08-21 16:39:42 663

原创 让大模型使用 byzerllm 从 0 实现RAG应用

这里我们使用了 auto-coder.chat 来实现编码。我们假设你对 auto-coder.chat 有个基本了解。首先添加两篇文章,这样大模型就可以学习文档来学会如何使用 byzerllm:/add_files /Users/allwefantasy/projects/byzer-llm/docs/zh/003_byzerllm_大模型编程快速指南.md/add_files /User...

2024-08-09 16:10:34 237

原创 auto-coder.chat: 如何自动化开发基于大模型的应用

大家都在积极的开发基于大模型的应用, 尽管大模型在前端,传统web,APP ,小程序等开发上展现了其高超的能力,但是如果我们是在开发基于大模型的应用的时候,我们还都使用基于传统,一点都不智能的方式(比如使用workflow 亦或者基于langchain/llama_index各种库在手写代码),这里,如何根据功能需求手写Prompt,以及prompt的工程化以及管理,同时涉及到底层向量数据存储等的...

2024-08-09 16:10:34 575

原创 从Python翻译Go代码谈起:AI辅助编程的现状与展望

最近,一位同学使用GPT-4o将一个约300行的Python程序转换成Golang,正确率达到了90%。这引发了一个有趣的讨论:如果是整个项目规模的代码转换,准确率会如何?作为被@的对象,我决定深入探讨这个话题,并借此机会分享一些关于AI辅助编程的见解。AI代码转换的成功率取决于项目复杂度AI代码转换的准确率很大程度上取决于项目的规模和复杂度:1. 对于单文件、仅使用标准库的Python项目,准确...

2024-07-31 22:48:11 6500 2

原创 Byzer Storage: 可甜可咸最易用的AI存储引擎

Byzer Storage是一个为 RAG 设计的高性能存储引擎,它提供了简单易用的Python API,支持向量搜索、全文检索以及结构化查询。本文将详细介绍Byzer Storage的使用方法和主要特性。Byzer Storage 也是 byzerllm 的一个子项目。0. 安装和启动pip install byzerllmbyzerllm storage startThat's it! By...

2024-07-06 13:34:36 393 1

转载 99.99%AI血统的打工人效率神器,帮你一键续写代码、文档、写作

想象一下,无论你在哪里输入文字,都有AI助手随时为你提供建议。作为Github Copilot和Chat-Auto-Coder的资深用户,我深感AI辅助输入的魔力。但是,为什么要局限于特定软件呢?Web Typing Auto-complete,你的Chrome浏览器全能AI输入助手,该插件采用 Chat-auto-coder 开发,99.99%的代码为AI生成,基于硅基流动提供的高并发低延迟的底...

2024-07-01 11:46:25 110

原创 我 开发了一个具有99.99% AI血统的软件

我是 Github Copilot 和 Chat-Auto-Coder的重度使用者。前者在编辑器里做代码提示,后者是通过命令行写文字来修改代码,迭代需求。有一段时间,我每次打字或者写代码,就忍不住要停顿一下,等 Github Copilot 给我做补全..... 然后呢,有时候网络不给力,就让我很难受。后面我就在想,这么好的东西,能不能让所有人在任何有文字需求的场景,都可以享受这种AI的自动补全。...

2024-06-29 20:16:14 410

原创 auto-coder 新agent 帮你自动撰写 auto-coder YAML 文件

其实当前大部分类似devin的系统,都是从“需求/目标”直接出发的。而 auto-coder 则是反其道而行的,先解决了从”设计“到”实现“,在夯实了这层之后,再去解决的是 ”需求/目标“到”设计“。什么事需求/目标?什么是设计?1. 我想给首页换个logo。这个就是需求和目标。2. 修改 index.tsx, 替换里面的 logo 路径为 xxxx/x.svg。这种就是详细可执行的设计。开放性问...

2024-06-11 11:23:36 474 1

原创 什么,一不小心打造了一个基于大模型的操作系统

如果以大模型为Kernel, 形成一个新的操作系统,那么:1. byzer-llm 是这个大模型操作系统的编程接口,有点类似Linux操作系统的C ABI。2. byzer-retrieval 也被集成进 byzer- llm 接口里,算是大模型操作系统的文件系统,应用可以通过python API 使用这个文件系统。3. byzer-agent 算是应用开发框架,并且支持分布式,跨多机。3. a...

2024-06-08 19:39:28 1060

原创 探讨大模型未来:从Scaling Law到数据红利再到终极Token工厂

这篇文章主要来自于上周和一个朋友三小时的聊天中非AI辅助编程的内容的一个回顾。本文主要内容包含三部分:工业化的Scaling Law:超越参数与数据数据红利:合成数据的潜力终极目标:Token工厂与Token GDPScaling Law 本质是工业化思维不过我觉得很多人对Scaling Law 还缺乏理解,单纯的还是在想“效果和参数规模等比上升”,现在应该遇到瓶颈是在数据。但实际上这么思考是不够...

2024-06-03 08:34:10 4104 1

原创 关于auto-coder的一次辩经

"其实是这样的,助手只要能给出正确的代码,粘贴一下,不是主要工作量"这种思路还是把大模型当成一个信息获取工具来用,那么注定难以变革生产力,他和搜索引擎没有任何区别,那么把搜索引擎换成大模型,会有大的变化么?我认为是没有的。未来的发展一定是我之前说的: 我边输入文字,大模型边修改代码,那边边预览效果。如果要达到这种状态,那么必然要绕过去自动合并代码这个障碍。可能一个月都不搞清楚这个产品怎么用这个问题...

2024-05-31 19:14:59 1497 1

原创 用 SQL 快速对百万图片生成图片解读

随着大模型百万token进入1元时代,在 SQL中调用大模型 很快要进入大众视野了。 对于业务数据库(数仓,数据湖),我们可以用Load加载任意数据库,或者文件系统的数据,然后用 select语句使用大模型UDF函数对每条记录或者聚合后的每条数据做处理,处理完用save语句保存回数据系统。打开web,三条语句完成一个业务需求。但是如果是去年,你可能一条SQL语句执行下去,会遇到两个情况:1. 账单...

2024-05-13 19:39:02 538

原创 经历了2000万token的洗礼后,我找到了辅助编程的最佳组合

背景当初在设计 AutoCoder 的时候,为了让 AutoCoder 保持 AI Native, 我其实做了很多艰难的设计决策。其中一个非常有挑战但是我最终坚持下来的就是项目索引采用大模型而不是采用以前的各种语法分析器,从而可以一套方案就能支持几乎所有语言的索引。这个决策虽然好处很明显,但是缺点在当时(所谓当时,其实也就两三个月前)也很明显,那就是索引构建/查询的速度和费用。接下来我们看看为啥速...

2024-05-08 12:41:10 824

原创 020- 使用AutoCoder本地快速构建程序员专有知识库

背景我现在有两类内容,一个是大量的 auto-coder 示例配置,每次我用的时候都需要去找示例,然后复制黏贴。第二类是各种启动模型的脚本:需要关闭或者开启一个模型,都需要查找然后复制黏贴,比较麻烦。这个时候,我就在想如何把这些内容构建成知识库,让问答小助手帮到自己,甚至小助手还可以直接帮我执行一些脚本。于是有了 AutoCoder 的文档功能。安装conda create --name auto...

2024-04-19 08:37:20 1078 1

原创 AutoCoder 副作用,秒变命令行版Siri,再也不用复制黏贴命来管理大模型了

AutoCoder 可以通过你指定的文档,以及自动到搜索引擎进行搜索来获取信息,从而更好的帮你生成代码,但我们不满足,我们还希望能够对用户本地的文档进行索引,从而自动获取一些信息,帮助你本地的项目更好的迭代,为此我们推出了一个本地的 Rag 知识库。结果没想到,解决了我一个以前一直很苦恼的问题,因为我经常要测试各种模型,这就需要经常启停一些模型,为此,我原来是这么做的,把我常用的一些模型的启动,关...

2024-04-17 17:12:31 2309 3

转载 使用大模型只需要像对接数据库一样,你喜欢了么

这里有个误区,大家看到 SQL + 大模型首先想到就是 nlp2sql,这是两件事,nlp2sql 是调用大模型将用户的问题转化为 SQL 查询, 而今天我们提到的 SQL + 大模型 指的是通过 SQL 调用大模型完成实际的业务数据处理,或者利用 SQL 完成大模型的训练,微调。用户使用大模型就和使用数据一样。为什么把大模型数据库化是最好的选择SQL 相比 Python 有其巨大的价值,首先是...

2024-04-12 13:39:21 186 1

原创 我们把 Prompt 函数和类更进一步了

前言上次我们发了一篇文章,很好的解决了 Prompt 的使用问题:最好的Prompt管理和使用依然是 Class 和 Function - 继续让LLM和编程语言融合相比其他方案,具有非常大的优势,完全融入到了现有的编程语言里,而不是大段的文本变量或者文件来做管理。阅读本文前,建议大家先阅读上面的文章获得一个基础认知,再来看看我们如何进一步简化其使用。问题我们来看下面一段代码:import ray...

2024-04-09 16:31:33 2260

原创 014 - AutoCoder 如何使用 Ollama

效果预警:AutoCoder 对大模型的要求偏高,请尽量使用模型参数较大的模型,并且观察是否能够满足 AutoCoder要求。Ollama 是一个很优秀的模型部署工具。 Byzer-LLM 则不仅仅支持类似 Ollama 的模型部署能力,还可以用于1. 开源或者私有模型训练、模型调参等2. 分布式3. 同时支持Saas模型4. 支持诸如Prompt函数/类等将大模型和编程语言融合的一些更加高阶的设...

2024-03-27 16:54:55 659

原创 010-AutoCoder 如何在公司级别使用

AutoCoder 如果是程序员用的话,一般 AutoCoder + SaaS 大模型,都会运行在程序员自己的电脑上。程序员还可以通过 human as model 模式,使用 Web 版本的模型。但是这种方式存在一定泄露源码的风险。如果公司想给自家的程序员统一使用 AutoCoder,并且对代码隐私有较高的要求,那么我们可以考虑私有化部署 AutoCoder 使用的大模型。私有化部署大模型Byz...

2024-03-26 13:54:58 434

原创 AI-Native的应用长什么样子

> 本文是某产品广告,请谨慎阅读有这么一个应用,他同时触发了大模型的三大软肋:效果 (GPT4直呼不够)长窗口(百万token输入,上万token输出)高成本 (因为输入输出巨大,效果要求还高,15块钱几次调用就耗尽)还有这么一个应用:代码混合了大量的常规类/函数和Prompt类/Prompt函数提供了显式的 human 模式常规的函数是这样的:所谓的Prompt 函数是这样的:实际上 Pr...

2024-03-26 13:54:58 654

转载 012-AutoCoder如何保障auto_merge模式下的代码安全

代码安全实际有两部分,一部分是代码不能被泄露,这个可以通过祝威廉:010-AutoCoder 如何在公司级别使用来解决。另一部分是如果开启了 auto_merge 模式,因为模型大模型的不确定性,很有可能破坏用户已有代码。比如用户可能忘了提交代码,马上又运行 AutoCoder ,并且开启了 auto_merge,很可能就覆盖掉了用户的代码。所以我们需要一些措施来保障代码的安全,这里我们鼓励大家...

2024-03-26 13:54:58 121

原创 011-AutoCoder最佳实践之组合大模型API/Web订阅

前面一篇文章,我们介绍了如何在公司级别使用AutoCoder,架构是这样的:而作为研发同学,实际上相当于把 大模型 Server 也放在自己的笔记本上。但受限于笔记本的性能,难以解决窗口(上下文)长度以及模型效果问题。而如果使用 SaaS API的话,这个Token费用在短期内又受不了(在模型厂商没有大规模降价或者AutoCoder 没有提供专有流量的时候)。那怎么真正把 AutoCoder 给利...

2024-03-26 13:54:58 430

原创 为什么不是Github Copilot,不是 Devin 而是 AutoCoder

我之前常说,不要逆AGI潮流去做一些事情,但也要对当前的大模型的边界有清晰的了解。Github Copilot 本质还是IDE工具的衍生,是一个更加“智能”的代码提示,而其提供的Copilot Chat 则更加只是把一个聊天框做到IDE而已,和集成一个搜索框到IDE工具没有任何区别,然还是一个古典产品的思维在做的一个产品。更细节的,我可以从三个维度做给大家做分析:第一个维度是 Github Cop...

2024-03-25 08:30:21 4032

原创 008-如何支持各种语言的项目

我们之前看到, AutoCoder 最简化的配置是这样的:source_dir: /tmp/t-pytarget_file: /home/winubuntu/projects/ByzerRawCopilot/output.txt query: > 修改 server.py ,在代码 app = FastAPI()后 增加 ray 的初始化连接代码。默认他会只处理 Pyth...

2024-03-25 08:30:21 307

原创 009-AutoCoder如何阅读第三方库源码

第三方库对程序员而言,是日常工作的重要部分,通常程序员的工作顺序如下:1. 阅读已有代码2. 阅读第三方库或者对接接口的文档3. 使用搜索引擎获得其他人使用第三方库的文档4. 自己阅读第三方库源码一般而言,1,2,3 应该是可以满足需求了的。而且,如果你的第三库是一个比较成熟的库,那么大模型对其知识应该也是足够的。通常我们并不需要 AutoCoder 去阅读第三方库的源码。但是有些库比较新,或者老...

2024-03-25 08:30:21 458

原创 007-番外篇 AutoCoder里配置的model究竟用来干嘛

AutoCoder 最简化的配置是这样的:source_dir: /tmp/t-pytarget_file: /home/winubuntu/projects/ByzerRawCopilot/output.txt project_type:pyquery:> 修改 server.py ,在代码 app = FastAPI()后 增加 ray 的初始化连接代码。指定项...

2024-03-24 08:31:13 354

原创 006-AutoCoder 开启索引,减少上下文

到今天为止,我们发现,AutoCoder 实际上会收集以下数据:通过 source_dir 指定的源码目录通过 urls 指定的文档通过search_engine 指定的搜索引擎检索结果你的需求描述第三方包(目前仅支持python)实际上当你在一个积累了很多年的项目上,你会发现项目代码有几十万行,尤其是 Java 代码,这导致大部门模型的上下文窗口无法满足需求。实际上,直接把所有源码都带上,确实也...

2024-03-24 08:31:13 212

原创 004-AutoCoder 边看代码 边看文档 写代码

程序员单纯编程部分,无非是1. 理解需求2. 搜索看别人怎么解决类似问题,理清思路3. 看已有项目的代码4. 看要用到的第三方库的源码或者文档AutoCoder 会模拟程序的这种行为来完成代码的编写。我们来看看具体如何让 AutoCoder 去完成这件事。source_dir: /tmp/t-pytarget_file: /home/winubuntu/projects/ByzerRawCop...

2024-03-23 08:30:32 352

原创 005-AutoCoder 使用搜索引擎

在上一篇内容中,我们介绍了 AutoCoder 可以同时看源码,同时阅读文档,最后结合你的需求进行代码的迭代。实际上,这个文档有两种可能性:接口或者SDK的文档一些设计思路通常接口或者SDK文档,通过 urls 参数指定是OK的,AutoCoder >= 0.1.18 同时还支持指定本地文件,并且支持 PDF,Word 等文档。但是如果你希望 AutoCoder 使用搜索引擎,寻找一些思路也...

2024-03-23 08:30:32 339

原创 003- AutoCoder 使用Web版大模型,性感的Human As Model 模式

这是下面这篇文章的继续。002- 用 AutoCoder 添加和修改代码前面我们提到,如何解决你没有API版大模型,或者你的API版大模型太弱,而你只有Web版本的诸如 Kimi/GPT4 的情况下,改如何让AutoCoder帮助你完成编程?我们有两个办法,第一个是去掉 execute/auto_merge 两个参数。这个时候你可以在 target_file 里找到你的prompt,拖拽到 Web...

2024-03-22 08:01:08 351

原创 002- 用 AutoCoder 添加和修改代码

实际上 AutoCoder 最适合的场景是修改代码,因为它最原始的功能是把源码+你指定的文档+搜索引擎搜集到的资料和你的需求生成一个prompt给到大模型。此外纠正大家一个观点, AutoCoder 不是一句话给你创建一个网站抑或一个大型的项目。我们是帮助研发或者产品更快的迭代产品。不过我们还是从最开始项目啥都没有开始,现在,我们用 AutoCoder 创建一个 web serversource_...

2024-03-21 18:12:14 387

原创 # AutoCoder-001自动创建模板项目

AutoCoder 系列教程开始了。作为程序员,那得先从创建一个项目开始。AutoCoder 提供了一个自动化创建项目的能力。不过这里大家要注意的是,因为每个模型能力不一样,甚至同一个模型每次给的答案都不一定稳定,所以这部分功能并不能稳定。这里我们依然推荐 Qwen-Max 来完成下面的工作。另外,大家回顾下如何安装 AutoCoder:AutoCoder 快速使用指南实战一,创建一个Python...

2024-03-20 08:30:10 697

原创 AutoCoder 快速使用指南

前言昨天发了命令行版Devin 来了: Auto-Coder后有不少人私信我讨论。那么能让大家快捷的用起来是第一要务。所以从昨天晚上到今天,我光速给 Byzer-LLM/AutoCoder 发了两个新版本,来支持今天这篇文章。安装安装部分其实比较简单,安装如下 python 库:condacreate--nameautocoderpython==3.10.11conda activa...

2024-03-19 12:28:46 1724

jQuery1.2API

jquery api 还是很不错的里面 可以搜索 用起来蛮方便的

2009-01-13

学习JavaFX脚本语言_翻译_.pdf

javaeye 一个博客提供过的 看了下 挺基础的 还不错

2009-01-13

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除