- 博客(1930)
- 收藏
- 关注
原创 大模型学习文档+教程+PDF书籍+系统学习路线,一套全拿到!
大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。事实上,抢你饭碗的不是AI,而是会利用AI的人。继科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?
2025-03-26 19:45:50
982
1
原创 其实你往 LLM 里塞的东西,大部分都是垃圾
RAG 这条路走了这么多年,有一件事几乎没人当着台面说:我们检索回来的大部分内容,其实没有被真正用上。
2026-05-08 17:40:28
175
原创 一文讲清:RAG到底是怎么工作的?(附简单实现思路)
RAG的核心思路可以一句话总结:在模型回答问题之前,先“查资料”,再回答。也就是不直接让LLM“凭记忆回答”,而是给它“开卷考试”,回答也就更贴近实际。
2026-04-22 14:03:52
371
原创 大模型上下文都过百万了,我们为什么还需要 RAG?
长上下文不代表 RAG 消失了,它只是让 RAG 的重心从“如何切分”转向了“如何调度”。以下是构建高性能长上下文 RAG 系统的 5 个关键工程实践。
2026-04-22 13:53:30
375
原创 AI Agent 是什么?从 LLM、Tools、Prompt 理解 Agent 本质
Agent 的实质是什么?用 LLM + Tools + Prompt 三元素框架拆解 Agent 设计核心,涵盖模型选型、工具分类与 Skill 积累,帮你从「会用」升级到「会设计」。
2026-04-20 15:56:07
345
原创 AI Agent工程师是什么?能干嘛?需要哪些技能?一文说清楚
AI Agent赛道持续爆发,Agent工程师成为科技行业最炙手可热的新岗位。但这个岗位到底做什么?和普通程序员有什么区别?普通人如何入行?本文一次性说清楚。
2026-04-20 15:55:20
411
原创 程序员转型大模型开发,可以转型成功吗?
程序员转型成为大模型(如深度学习或大规模语言模型)的开发者是完全可能的,尤其是随着人工智能领域的快速发展,这一领域的需求也在不断增长。
2026-04-17 11:17:59
214
原创 5款Embedding模型横评:中文RAG该选哪款?
我上周花了一周时间搭了个测试环境:5000篇中文技术文档,200个真实查询,5款Embedding模型挨个跑了一遍。
2026-04-14 10:16:57
545
原创 本地部署大模型全指南:从 Ollama 到 vLLM,性能差距有多大?
Google 在 Hugging Face 发布了 Gemma-4 31B, 5 天内下载量突破 67 万次。几乎同时,阿里的 Qwen3.5 27B 也以日均 50 万次的下载量霸榜。
2026-04-10 11:17:04
606
原创 中年程序员想破局?转型大模型,为啥是当下最靠谱的路?
还记得几年前互联网行业流传的那些段子吗?35岁以上的程序员成了企业“优化”名单上的常客,理由似乎很“充分”——IT技术迭代如同翻书,年纪稍长便被贴上“学习慢、精力差、熬不动夜”的标签。
2026-04-08 10:23:38
356
原创 大模型不是短期热潮,而是产业新地基!30+程序员抓住AI转型,就是握住下一个十年的职业主动权
2025年,随着AI代码生成工具在企业级开发中渗透率突破60%,传统CRUD岗位招聘需求同比缩减28%,不少资深程序员陷入职业焦虑。
2026-04-08 10:22:37
442
原创 高阶RAG技巧:探索提升RAG系统性能的不同技巧
本文讨论了我们可以应用的各种高级技术来提高 RAG 系统的性能。这些技术可以应用于 RAG 流水线的各个阶段
2026-04-07 10:06:02
204
原创 从0到1开发一个商用 Agent(智能体)
接下来,将结合实际Demo, 从整体架构到核心模块的实现,完整展现一个多Agent协同系统的开发过程。
2026-04-03 11:08:58
338
原创 从“聊天工具“到“数字徒弟“:一文看懂什么是 AI Agent
程序员给大模型写了一整套"外部代码框架"。框架里提前写好:怎么调搜索引擎、怎么读本地文件、怎么点邮件的"发送"。
2026-04-03 11:08:12
385
原创 从被动唤醒到主动守望:基于AI Agent的智能任务架构实践
本文将分享AI Agent团队在“小高老师 AI Agent”中如何构建一套可感知、可交互、可管理的智能任务框架,探讨从技术选型到架构演进的全链路迭代。
2026-04-01 10:55:16
401
原创 RAG存在的问题及解决方案
今天给大家梳理一篇核心论文📝《Seven Failure Points When Engineering a Retrieval Augmented Generation System》中提到的RAG七大核心痛点,搭配对应解决方案,干货满满✨,建议收藏!
2026-04-01 10:54:32
351
原创 一文学会如何构建无向量 RAG 系统
本文将构建一个无向量的、基于推理的 `RAG` 系统,使用分层页面索引。文档被转换为树结构,`LLM` 在树中推理以找到答案。无需嵌入。无需相似性搜索。
2026-03-31 11:19:01
178
原创 一文搞懂 RAG,手把手搭智能问答助手
在没有 RAG 的时候,大模型生成内容的方式,说穿了就是 “闭卷考试”—— 全靠自己脑子里的 “老底” 硬拼。
2026-03-31 11:18:28
238
原创 RAG 必看!检索不准?全靠 rerank 救场
RAG系统中, 检索(retrieval)步骤完成之后, 可以从矢量数据库中根据相似性, 把相关的文档切片读取出来, 而文档切片的相关性排序, 对于最终的生成结果, 影响很大.
2026-03-30 10:18:21
254
原创 RAG 2.0 时代:从检索增强到主动推理的演进之路
RAG 2.0 不是终点,而是起点。随着 LLM 能力持续提升,我们将看到更智能、更自主的 AI 系统,而 Agentic RAG 正是通往这个未来的桥梁。
2026-03-30 10:17:46
380
原创 RAG技术深度解析(四):召回与重排技术实战指南
本篇进入在线检索环节——当用户提出问题后,系统如何在毫秒级从百万文档中找到最相关的证据,又如何把"大致相关"精炼为"精准匹配"。
2026-03-29 08:00:00
295
原创 RAG技术深度解析(三):向量数据库与索引优化实战
在上一篇文章中,我们掌握了文档分块和向量化技术。但向量化之后的数据该怎么存?怎么快速找到?本篇将深入索引算法和向量数据库——它们决定了RAG系统"找得快不快、找得准不准"。
2026-03-28 10:30:24
178
原创 RAG技术深度解析(一):基础概念与系统架构
在AI大模型时代,ChatGPT经常"一本正经地胡说八道",企业内部知识文档却无法被利用。如何解决?答案是RAG技术——让AI从"只会背书"变成"会查资料"的智能助手。
2026-03-28 10:28:32
358
原创 开源|RAG知识库如何搭建?企业 AI 知识库搭建全流程
RAG 技术通过检索 + 生成的双重逻辑,先从企业私有知识库中检索相关知识,再让大模型基于检索到的精准信息生成回答,完美结合了企业知识的专业性和大模型的语言生成能力。
2026-03-27 15:12:50
435
原创 卷完提示词卷上下文,2026年卷“赛道“:AI程序员时代来了
OpenAI说,这个实验的目的不是炫技。他们想知道一件事:AI程序员到底需要什么环境,才能大规模可靠地工作?
2026-03-27 15:12:20
337
原创 一文搞懂训练大模型的数据怎么存储!
在大模型时代,AI 的训练与推理已经不再是单纯的算力问题。随着模型参数规模进入百亿级、数据量级扩展到 TB~PB,数据管线与存储架构往往成为影响训练速度的决定性因素。
2026-03-26 10:18:09
401
原创 一文搞懂大模型的发展历程!
大模型的发展并不是一蹴而就的,它有一条清晰的演变路线,从早期的词向量到如今的万亿参数大模型,每一步都在推动AI能力的边界。
2026-03-26 10:17:03
332
原创 Java程序员如何借力AI突围:从CRUD到智能开发的转型指南
对Java开发者而言,AI不是威胁,而是杠杆——利用现有工程化经验,叠加AI能力,可以打开更高价值的职业路径。
2026-03-25 15:41:31
408
原创 Java+RAG开发手册:从文档处理到生成优化的完整代码实现
本文将深入探讨如何利用Java生态系统结合RAG技术,从原理到实践,手把手带你构建一个完整的智能问答系统。
2026-03-25 15:40:51
419
原创 AI如何学会“翻墙查资料”?深度解码RAG+MCP黑科技
本文深入探讨两大技术在信息实时性、知识精准度及多维度感知方面的突破性价值及其协同演进路径。
2026-03-25 15:40:18
288
原创 从Java到Agent开发:3个月转型指南,轻松掌握大模型应用核心能力
今天,就为大家带来一份专为Java开发者定制的3个月大模型Agent开发转型计划,从基础入门到企业级部署,全程干货拉满,帮你平稳过渡,实现技能升级!
2026-03-24 14:25:24
413
原创 大模型Prompt Prefill慢与首Token延迟优化:原理剖析与工程实践
随着RAG应用的普及和上下文窗口的扩展(从4K到128K甚至更长),长Prompt场景已成为常态,TTFT优化的重要性日益凸显。
2026-03-24 14:24:48
485
原创 传统Java开发者的AI逆袭:月薪从15K到30K的华丽转身
最近,我们对成都地区50多名Java开发者进行了深度调研,得到了一个让人震惊的数据:传统Java开发者中,已有60%开始转向AI应用开发,而他们的薪资普遍实现了增长。
2026-03-24 14:23:58
339
原创 2026年大模型微调框架全景指南
想要打造属于自己的AI助手?大模型微调是必经之路。本文为你梳理当前最主流的微调框架和平台,助你高效完成模型训练。
2026-03-23 10:30:28
618
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅