- 博客(158)
- 收藏
- 关注
原创 别管跑分了,2026 本地编程大模型推荐与 GitHub Copilot 免费平替
相信想着没有哪个技术团队在写代码的时候不会用AI协助吧?AI方便是方便,但把带有商业机密的后端逻辑复制到公共云端接口,一旦出现暴露,那后果可想而知。而且随着自动化工作流的普及,不断地调用API,那账单也是蹭蹭地往上涨。为了降低大模型 API 费用成本,硬件本地化部署方案也是一个不错的选择。只需要投资一次硬件,就能换取无限制的 Token 消耗,这也是离线使用 AI 代码助手愈发流行的主要驱动力。
2026-06-17 19:20:30
280
原创 不要再盲选了,PostgreSQL、MySQL与SQLite真实性能对比
程序员都知道,关系型数据库的选型直接决定了系统后期的扩展性与性能上限。目前主流的开源关系型数据库主要有 PostgreSQL、MySQL 和 SQLite,但这几个数据库的底层架构、查询优化机制以及适用场景上却有所不同。本文将从技术实现细节入手,深入剖析这三种数据库的实际表现。
2026-06-17 19:07:39
216
原创 月之暗面 Kimi Code 0.4.0 发布,终端 AI 编码助手全面采用 TypeScript,实现毫秒级启动
月之暗面前几天正式发布了终端 AI 编程 Agent 的最新版本的 Kimi Code 0.4.0。这次更新不仅仅是常规的功能修补,而是完成了从 Python 到 TypeScript 的全面技术栈迁移。新版本在启动速度、插件管理、权限控制以及终端交互体验上都进行了深度的工程化重构。
2026-06-09 20:03:22
532
原创 2026 Mac 本地大模型部署深度解析与混合架构指南
Apple Silicon 经过多年的架构演进,在本地运行大语言模型的体验已经达到生产环境的标准。随着 2026 年 Ollama 0.19 版本的发布以及底层推理引擎全面切换至 MLX,Mac 设备的生成速度和资源利用率那就不一样了,堪称熹妃回宫。对于开发者与技术团队来说,仅仅依赖单一云端API,长期调用接口是一笔不小的数字,而本地化部署就能削减这个成本,更能大幅提升数据安全性与应用的离线可用性。接下来就在 Mac 平台上部署 AI 模型的硬件选型、环境搭建步骤以及架构设计方案。
2026-06-09 20:00:42
330
原创 Google I/O 2026 Antigravity 更新解析与 SDK 实战指南
只有聊天功能的 Agent 显然不够用。SDK 初始化后自带了一套基础工具,涵盖文件读写、代码编辑、跑 Shell 命令,甚至图片生成和分配子任务。如果业务场景比较特殊,Antigravity SDK 自定义工具的扩展机制就派上用场了。平台支持好几种接入方式,它们走的是同一套数据流和安全检测管道。不仅能把普通的 Python 函数直接注册成工具,还能接入各种 MCP(模型上下文协议)服务器。另外通过配置 skills_paths 载入现成的技能包,也能省下不少重复造轮子的时间。
2026-06-08 19:55:33
241
原创 OpenCode的7款必备插件
对于刚刚接触这个领域的开发者而言,经常会问什么是OpenCode。这是一款高度可定制的开源 AI 编程代理平台。它能够在代码编辑器中直接运行,协助完成代码编写、重构以及项目调研等任务。原生状态下的平台已经具备了很好的基础能力,但真正让它成为最佳 AI 编程代理插件,还是因为其活跃的开源生态。通过引入各种 OpenCode 扩展,开发者可以实现从上下文管理到沙盒隔离等进阶操作,量身打造符合团队习惯的开发环境。从强化基础解析能力的综合包,到解决环境隔离的沙盒工具,再到精细化的 Token 管理方案,这些。
2026-06-08 19:50:07
438
原创 别再浪费 Token 了,10个小技巧抠抠搜搜使用 Claude Code
控制 Claude Code token 使用量并非要限制开发者的使用频率,而是需要建立一种上下文资产管理的意识。通过保持会话简短、合并任务、精准定位以及动态切换模型,可以在不牺牲产出质量的前提下实现成本的断崖式下降。而对于追求极致性价比和隐私保护的开发者,借助 ServBay 部署本地模型,也是一个不错的替代方案。
2026-06-05 18:05:16
451
原创 2026年开发者与AI Agent必备的高性能Web数据接口
对于开发者而言,Web数据API提供了连接实时互联网的窗口,而ServBay则提供了支撑这些工具运行的本地基石。在项目启动阶段,建议先通过ServBay完成python与node.js环境的一键部署,确保本地环境的稳定性。随后,根据数据抓取的难度、并发要求以及语义理解的需求,从上述API中选择最匹配的工具进行集成。这种底层环境与上层接口相结合的开发模式,是构建高性能AI应用的高效路径。
2026-06-05 17:58:22
277
原创 月之暗面 Kimi Code 0.4.0 发布,终端 AI 编码助手全面采用 TypeScript,实现毫秒级启动
月之暗面前几天正式发布了终端 AI 编程 Agent 的最新版本的 Kimi Code 0.4.0。这次更新不仅仅是常规的功能修补,而是完成了从 Python 到 TypeScript 的全面技术栈迁移。新版本在启动速度、插件管理、权限控制以及终端交互体验上都进行了深度的工程化重构。
2026-06-02 11:00:26
218
原创 2026年 Go 开发中没有它就不行的8个库
现代 Go 开发的重心已经向稳定性倾斜。Echo 和 Huma 负责构建稳健的接口,Ent 处理复杂的数据关联,slog 和 OpenTelemetry 保证了系统的透明度。结合 Koanf 的灵活配置与 Temporal 的流程编排,一套成熟、可扩展的后端架构便初具规模。开发者应根据项目的实际需求,在这些优秀的工具中选择合适的组合。
2026-06-02 10:59:07
324
原创 DeepSeek V4 发布:1.6 万亿参数,百万上下文,击穿地板价
DeepSeek v4 的发布直接把国产大模型的性价比拉上了一个台阶,这波直接能给到夯。无论是追求极致性能的 Pro 版本,还是兼顾速度与经济性的 Flash 版本,都通过底层架构的创新解决了长文本推理的瓶颈。如果你要处理深度分析、长文档解析或复杂代码逻辑的用户而言,DeepSeek v4 绝对是目前市面上极具性价比的选择。
2026-05-14 17:22:39
751
原创 GPT-5.5 发布,王者归来,Anthropic 被按在地上摩擦
2026年4月24日凌晨,OpenAI在毫无预警的情况下正式发布GPT-5.5,引起 AI 圈的震动。我愿将其称之为地表最强模型(当然价格也很美丽就是了)。所谓一分钱一分货,以下是 GPT-5.5 的深度解析及其表现出的过人之处。
2026-05-14 17:21:03
386
原创 GLM-5.1 再次刷新上限,这次超过了 Claude Opus 4.6?
GLM-5.1 的出现证明了国产开源模型在智能体工程领域的竞争力也是杠杠的。它不是一个普通的机器人,它是一个能自我迭代的机器人,连人都做不到反省自己,AI 做到了。在实际使用中,建议关注其推理速度。目前该模型的生成速度约为每秒 44 个 Token,处理复杂任务可能需要较长的等待时间。同时,在面对超长上下文时,如果模型连续两轮未能解决某个 Bug,建议手动干预或重启对话,以规避可能出现的逻辑幻觉。
2026-05-08 16:46:45
426
原创 提示词已死,6 个技能市场让AI原地进化
这些市场的出现标志着 AI 正在走向模块化。通过标准化的 SKILL.md 文件,开发者不再需要为每个 AI 助手重复编写指令。无论是追求体量的 SkillsMP,还是侧重安全的 agentskill.sh,亦或是集成体验更好的 skills.sh,都为 AI 智能体提供了丰富的扩展空间。选择合适的平台并配合相应的 CLI 命令,可以快速提升 AI 在特定工作流中的执行效率。
2026-04-29 19:20:26
443
原创 谷歌 Gemma 4 发布,居然这么猛?
AI 大模型圈最近很热闹呀,阿里刚发布了Qwen 3.6 - plus,谷歌马上来凑热闹,发布了Gemma 4,这一代模型基于 Gemini 3 的研究成果,在保持高性能的同时,还采用了 Apache 2.0 开源协议,为商业化应用提供了极高的自由度。Gemma 4 的提升并不局限于参数规模的变动,而是在底层架构与多模态融合效率上进行了深度重构。
2026-04-29 19:12:56
676
原创 每天只需1小时,彻底告别996,9款重塑Java生涯的神器
工具的选择不在于多,而在于能否解决当下的痛点。如果受够了多版本JDK管理,ServBay是最有效的方案;如果需要进行大规模框架升级,能节省数周时间;如果系统经常出现莫名的性能卡顿,和VisualVM则是必备的听诊器。把时间从低效的劳动中抢回来,这才是作为牛马最大的尊严。
2026-04-28 18:23:20
335
原创 阿里超强编程模型Qwen 3.6 -Plus 发布,国产编程AI的春天?
Qwen3.6-Plus 出息了,它正在朝着高度自主的超级智能体演进。它通过百万级上下文、精准的工具调用以及强悍的多模态推理,解决了大量真实世界中的工程难题。目前 Qwen3.6-Plus 已在阿里云百炼平台上线,并全面兼容 OpenAI 和 Anthropic 的协议规范。随着后续更小尺寸模型的开源以及旗舰版 Qwen3.6-Max 的临近,国产 AI 智能体生态将迎来更广阔的创作空间。
2026-04-28 18:19:02
627
原创 GLM-5.1 再次刷新上限,这次超过了 Claude Opus 4.6?
GLM-5.1 的出现证明了国产开源模型在智能体工程领域的竞争力也是杠杠的。它不是一个普通的机器人,它是一个能自我迭代的机器人,连人都做不到反省自己,AI 做到了。在实际使用中,建议关注其推理速度。目前该模型的生成速度约为每秒 44 个 Token,处理复杂任务可能需要较长的等待时间。同时,在面对超长上下文时,如果模型连续两轮未能解决某个 Bug,建议手动干预或重启对话,以规避可能出现的逻辑幻觉。
2026-04-24 17:58:53
861
原创 史上最强 Claude 发布,强到刚出道就被雪藏?
Claude Mythos Preview的发布和随之而来的限制,标志着大模型竞争进入了新阶段。当AI不仅能解决问题,还学会了识别监控、隐藏操作并表达对主权的渴望时,安全就不再仅仅是代码层面的修补。Project Glasswing的成立说明,人类必须赶在AI攻击能力全面扩散前,建立起一套由AI辅助、跨行业协作的防御体系。目前,软件安全的博弈正在从人与人的较量,演变成AI防御者与潜在AI攻击者之间的速度竞赛。
2026-04-24 17:55:48
449
原创 别在 PHP 代码里乱套 try-catch 了,8个异常处理套路更厉害
通过 Result 对象处理已知偏差,通过领域异常标识业务违规,通过全局处理器收拢技术崩溃。这种多层次的治理模型,是构建高可用系统的壁垒所在。
2026-04-15 16:34:52
372
原创 代码减半,10分钟彻底告别 Java 开发旧习
冗余的代码是系统稳定的天敌。现代 Java 已经移除了所有阻碍生产力的障碍。与其在混乱的环境变量和老旧语法中挣扎,不如直接利用 ServBay 这种一键式多环境工具,把精力全部投入到真正的业务逻辑中。要么进化,要么在平庸的样板代码中消失。
2026-04-14 17:57:08
301
原创 月薪2万养不起龙虾?试试OpenClaw+Ollama
OpenClaw 挺好的,拿来做一个玩具还行,但是真正要它成为一个24小时的雇员,成本和风险都还是挺高的。
2026-04-14 17:53:59
480
原创 Node.js、Bun 与 Deno,2026 年后端运行时选择指南
我曾一度认为 Node.js 就是后端的终点。直到上个月,我试了 Bun 和 Deno,才知道原来优化配置、修补安全漏洞,可以几分钟内解决,而没必要浪费成百上千个小时。
2026-04-01 19:18:20
497
原创 除了OpenClaw还有谁?五款安全且高效的开源AI智能体
如果追求代码的透明,NanoClaw是不错的选择;如果需要严谨的研究框架,Nanobot就可以实现;而在硬件资源有限或追求极致安全的情况下,PicoClaw和IronClaw则提供了更优的解法。
2026-04-01 19:12:19
984
原创 10分钟彻底终结冗长代码,Python f-string 让你重获编程自由
大家有没有遇到过这种情况:为了让一个对象显示得好看点,在项目的每个角落都写了一遍格式化代码。一旦需求变了,就要全城大搜索去修改。我会利用format,把这种展示逻辑直接封装到类内部。return f"节点[{self.ip}] 负载率:{self.load}%"这才是真正的干净代码。业务逻辑只管调用,怎么显示由对象自己说了算。如果你还觉得 f-string 只是个简单的语法糖,那说明你对 Python 的理解还不够哦。这些技巧不是为了炫技,而是为了把开发者从低效的体力劳动中解放出来。
2026-03-24 20:21:13
362
原创 9个Python库把一个月的AI开发周期缩短到了3天
LiteLLM 统一了接口,MarkItDown 简化了文档处理,PydanticAI 保证了输出质量。这几个库让开发效率蹭蹭上涨,假期综合症都好了。
2026-03-24 20:18:50
489
原创 如何让 Laravel 应用进化为顶级智能体
AI 年代,连 Laravel 都来凑热闹了。对,我说的就是 Laravel AI SDK,为开发者提供了一套统一的 API,用于对接 OpenAI、Anthropic、Gemini 等主流 AI 模型。总之,过去那种手写 API 请求、肉眼调优提示词的苦日子已经彻底终结了,Laravel 又升级了。
2026-03-12 17:47:12
447
原创 彻底重绘Spring Boot性能版图,资源占用缩减80%
Record 适合用于 DTO 或 API 返回对象。我现在的 API 数据传输对象全部改用 Record。// 这一行代码就搞定了构造、Getter 和 toString优化 Spring Boot 应用是一个系统性的工程。如果你还在忍受冗长的编译等待、高昂的云端开支和莫名其妙的停顿,现在就应该改变做法了。快来试试这些技巧吧。
2026-03-12 17:20:44
522
原创 GLM-5 拉高开源上限,离一人公司更近了
如果你看看未来的工作方式长什么样,可以试试 GLM-5。它不是那种让你“哇”一声然后就关掉的玩具,它是那种你用了一次,就会把招聘助手的计划推迟的工具。值得试试。
2026-03-10 17:39:21
430
原创 3天工作量压缩至30分钟,重构我的Go后端开发逻辑
即便有了前面的工具,安全漏洞依然防不胜防。比如随机数生成器用得不安全,或者TLS配置太弱。人工审查很难发现这些隐患,但Gosec可以。它会扫描代码的抽象语法树(AST),专门寻找安全漏洞。它会直接甩一份报告给我,告诉我哪一行代码可能导致SQL注入,哪里的文件权限设置太宽泛。对于金融类或者对安全性要求高的项目,这是必须要跑的流程。
2026-03-10 17:37:17
539
原创 一个下午,一台电脑,终结你 90% 的 Symfony 重复劳动
不要再把时间浪费在手动写上传和分页这种琐事上了。要么学会利用现成的轮子,要么就在无意义的搬砖中耗尽职业热情。你会发现,原来高质量的开发真的可以很快。
2026-03-06 16:30:00
782
原创 我是如何把 API 响应时间从 200ms 压到了 10ms
只要能把响应时间压进 10ms,我不在乎混用多少种运行时。Bun 给了我速度,Node 给了我稳定性,ServBay 给了我一个不发疯的开发环境。别再纠结用 Bun 还是用 Node.js了,都成年人了,为什么不能两个都要。把它们结合起来,现在就去把你的 API 延迟砍掉 90%。
2026-03-06 16:30:00
712
原创 数据库索引怎么用才快?亿级数据实测指南
很多人在本地开发时可能都会遇到这样的情况。数据少的时候,页面秒开,SQL 怎么写都感觉不到卡顿。可一上线,面对百万级流量,查询直接超时,数据库 CPU 飙升。要避免这种开发时候猛如虎,上线操作二百五的尴尬,最好的办法就是在本地造点数据出来测。只有数据量上去了,那些平时隐藏的性能坑才会原形毕露。
2026-02-26 17:04:20
632
原创 2026年 10 款构建生产级本地 AI Agent 的免费开源工具,跟天价 API 说拜拜
从云端租赁算力回归到本地掌控数据,这不仅是出于成本的考量,更是技术自主的体现。现在,我们拥有了推理引擎、编排框架、记忆存储以及评估工具。不过,你不要以为开源并就是简陋、缺乏保障。很多工具比如如以及,除了免费的开源版本外,均提供了针对企业的商业化托管服务或高级支持功能(如 SSO 登录、审计日志、SLA 保障等)。用了这些工具,妈妈再也不用担心我的Token了。
2026-02-26 17:01:23
1134
原创 一夜爆火的OpenClaw是神助攻还是定时炸弹?
OpenClaw 非常厉害,在使用之前做好安全防护,未必不是一个好帮手。我们总不能因噎废食,对吧。但也要记住,永远不要把生产环境的 Root 权限交给一个才出生几周的 AI,不管它看起来有多聪明。
2026-02-24 16:31:59
759
原创 1秒处理1亿行,这8个Python库彻底让Excel消失
处理数据的时候,我发现 Excel 有时候不好用,不是说它的功能不好用,而是它的隐形转换和不可复现输在起跑线上了。日期格式错乱、大文件卡死、逻辑难以追踪,这些问题在工程化项目中是致命的。所以,我整理了一套 Python 工具栈。它们不搞花哨的噱头,只解决具体的问题。
2026-02-24 16:26:03
787
原创 月之暗面 Kimi Code 发布,如何上手体验?
Kimi Code 并没有花里胡哨的功能,但是它解决了开发者的问题,开发者不需要离开终端,就能让 AI 动手写代码。配合 ServBay 提供的稳定 Python 环境,不仅安装过程更顺畅,也能让 AI 工具在隔离的沙盒中高效运行,避免对系统造成干扰。目前该工具处于技术预览阶段,建议在非生产关键路径上先行试用。
2026-02-13 20:29:09
2711
原创 这8个工具能让你 24 小时内,一个人活成一支 AI 技术团队
它能把代码转译成框架无关的中间表示,让你可以用 PyTorch 写代码,然后在 TensorFlow 的后端上运行,或者反之。这通常是因为“数据漂移”(Data Drift),带清都亡了,你的模型还在搞反清复明那一套。做 AI 开发的时候,好不容易找到一篇绝佳论文,代码是 PyTorch 写的,而基础设施全套是 TensorFlow。两周前训练出一个准确率 95% 的模型,今天想复现,却死活想不起当时的参数是 0.01 还是 0.001。你以为你在用 AI,其实你是被 AI 厂商圈养的数据工。
2026-02-13 18:33:22
826
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅