自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1930)
  • 收藏
  • 关注

原创 大模型学习文档+教程+PDF书籍+系统学习路线,一套全拿到!

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。事实上,抢你饭碗的不是AI,而是会利用AI的人。继科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

2025-03-26 19:45:50 982 1

原创 其实你往 LLM 里塞的东西,大部分都是垃圾

RAG 这条路走了这么多年,有一件事几乎没人当着台面说:我们检索回来的大部分内容,其实没有被真正用上。

2026-05-08 17:40:28 175

原创 一文讲清:RAG到底是怎么工作的?(附简单实现思路)

RAG的核心思路可以一句话总结:在模型回答问题之前,先“查资料”,再回答。也就是不直接让LLM“凭记忆回答”,而是给它“开卷考试”,回答也就更贴近实际。

2026-04-22 14:03:52 371

原创 大模型上下文都过百万了,我们为什么还需要 RAG?

长上下文不代表 RAG 消失了,它只是让 RAG 的重心从“如何切分”转向了“如何调度”。以下是构建高性能长上下文 RAG 系统的 5 个关键工程实践。

2026-04-22 13:53:30 375

原创 AI Agent 是什么?从 LLM、Tools、Prompt 理解 Agent 本质

Agent 的实质是什么?用 LLM + Tools + Prompt 三元素框架拆解 Agent 设计核心,涵盖模型选型、工具分类与 Skill 积累,帮你从「会用」升级到「会设计」。

2026-04-20 15:56:07 345

原创 AI Agent工程师是什么?能干嘛?需要哪些技能?一文说清楚

AI Agent赛道持续爆发,Agent工程师成为科技行业最炙手可热的新岗位。但这个岗位到底做什么?和普通程序员有什么区别?普通人如何入行?本文一次性说清楚。

2026-04-20 15:55:20 411

原创 程序员转型大模型开发,可以转型成功吗?

程序员转型成为大模型(如深度学习或大规模语言模型)的开发者是完全可能的,尤其是随着人工智能领域的快速发展,这一领域的需求也在不断增长。

2026-04-17 11:17:59 214

原创 5款Embedding模型横评:中文RAG该选哪款?

我上周花了一周时间搭了个测试环境:5000篇中文技术文档,200个真实查询,5款Embedding模型挨个跑了一遍。

2026-04-14 10:16:57 545

原创 AI Agent任务完成率从41%到92%:3种架构怎么选

今天这篇,帮你搞清楚三种主流Agent架构到底怎么选。

2026-04-14 10:16:27 381

原创 本地部署大模型全指南:从 Ollama 到 vLLM,性能差距有多大?

Google 在 Hugging Face 发布了 Gemma-4 31B, 5 天内下载量突破 67 万次。几乎同时,阿里的 Qwen3.5 27B 也以日均 50 万次的下载量霸榜。

2026-04-10 11:17:04 606

原创 一文看懂Transformer:小白也能看懂

这段时间忙于项目,断更了一段时间,借着节假日下暴雨的时间,给大家奉上一篇AI 原理篇白话版文章。

2026-04-10 10:39:29 176

原创 中年程序员想破局?转型大模型,为啥是当下最靠谱的路?

还记得几年前互联网行业流传的那些段子吗?35岁以上的程序员成了企业“优化”名单上的常客,理由似乎很“充分”——IT技术迭代如同翻书,年纪稍长便被贴上“学习慢、精力差、熬不动夜”的标签。

2026-04-08 10:23:38 356

原创 大模型不是短期热潮,而是产业新地基!30+程序员抓住AI转型,就是握住下一个十年的职业主动权

2025年,随着AI代码生成工具在企业级开发中渗透率突破60%,传统CRUD岗位招聘需求同比缩减28%,不少资深程序员陷入职业焦虑。

2026-04-08 10:22:37 442

原创 高阶RAG技巧:探索提升RAG系统性能的不同技巧

本文讨论了我们可以应用的各种高级技术来提高 RAG 系统的性能。这些技术可以应用于 RAG 流水线的各个阶段

2026-04-07 10:06:02 204

原创 大数据秋招面试总结:大模型微调技术概要

随着大模型的迅速发展,笔者在刚经历的秋招面试中,深感会大模型已经从原来的加分项变成了如今的必须项。

2026-04-07 10:05:24 229

原创 从0到1开发一个商用 Agent(智能体)

接下来,将结合实际Demo, 从整体架构到核心模块的实现,完整展现一个多Agent协同系统的开发过程。

2026-04-03 11:08:58 338

原创 从“聊天工具“到“数字徒弟“:一文看懂什么是 AI Agent

程序员给大模型写了一整套"外部代码框架"。框架里提前写好:怎么调搜索引擎、怎么读本地文件、怎么点邮件的"发送"。

2026-04-03 11:08:12 385

原创 从被动唤醒到主动守望:基于AI Agent的智能任务架构实践

本文将分享AI Agent团队在“小高老师 AI Agent”中如何构建一套可感知、可交互、可管理的智能任务框架,探讨从技术选型到架构演进的全链路迭代。

2026-04-01 10:55:16 401

原创 RAG存在的问题及解决方案

今天给大家梳理一篇核心论文📝《Seven Failure Points When Engineering a Retrieval Augmented Generation System》中提到的RAG七大核心痛点,搭配对应解决方案,干货满满✨,建议收藏!

2026-04-01 10:54:32 351

原创 一文学会如何构建无向量 RAG 系统

本文将构建一个无向量的、基于推理的 `RAG` 系统,使用分层页面索引。文档被转换为树结构,`LLM` 在树中推理以找到答案。无需嵌入。无需相似性搜索。

2026-03-31 11:19:01 178

原创 一文搞懂 RAG,手把手搭智能问答助手

在没有 RAG 的时候,大模型生成内容的方式,说穿了就是 “闭卷考试”—— 全靠自己脑子里的 “老底” 硬拼。

2026-03-31 11:18:28 238

原创 RAG 必看!检索不准?全靠 rerank 救场

RAG系统中, 检索(retrieval)步骤完成之后, 可以从矢量数据库中根据相似性, 把相关的文档切片读取出来, 而文档切片的相关性排序, 对于最终的生成结果, 影响很大.

2026-03-30 10:18:21 254

原创 RAG 2.0 时代:从检索增强到主动推理的演进之路

RAG 2.0 不是终点,而是起点。随着 LLM 能力持续提升,我们将看到更智能、更自主的 AI 系统,而 Agentic RAG 正是通往这个未来的桥梁。

2026-03-30 10:17:46 380

原创 Qwen2.5 全系列的本地部署配置清单,你的电脑配置够用吗?

Qwen2.5 全系列的本地部署配置清单,你的电脑配置够用吗?

2026-03-30 10:17:09 744

原创 RAG技术深度解析(四):召回与重排技术实战指南

本篇进入在线检索环节——当用户提出问题后,系统如何在毫秒级从百万文档中找到最相关的证据,又如何把"大致相关"精炼为"精准匹配"。

2026-03-29 08:00:00 295

原创 RAG技术深度解析(三):向量数据库与索引优化实战

在上一篇文章中,我们掌握了文档分块和向量化技术。但向量化之后的数据该怎么存?怎么快速找到?本篇将深入索引算法和向量数据库——它们决定了RAG系统"找得快不快、找得准不准"。

2026-03-28 10:30:24 178

原创 RAG技术深度解析(二):文档分块与向量化技术详解

本篇将深入离线阶段的两大核心技术——文档分块和向量化,它们决定了RAG系统检索质量的上限。

2026-03-28 10:29:22 240

原创 RAG技术深度解析(一):基础概念与系统架构

在AI大模型时代,ChatGPT经常"一本正经地胡说八道",企业内部知识文档却无法被利用。如何解决?答案是RAG技术——让AI从"只会背书"变成"会查资料"的智能助手。

2026-03-28 10:28:32 358

原创 开源|RAG知识库如何搭建?企业 AI 知识库搭建全流程

RAG 技术通过检索 + 生成的双重逻辑,先从企业私有知识库中检索相关知识,再让大模型基于检索到的精准信息生成回答,完美结合了企业知识的专业性和大模型的语言生成能力。

2026-03-27 15:12:50 435

原创 卷完提示词卷上下文,2026年卷“赛道“:AI程序员时代来了

OpenAI说,这个实验的目的不是炫技。他们想知道一件事:AI程序员到底需要什么环境,才能大规模可靠地工作?

2026-03-27 15:12:20 337

原创 一文搞懂训练大模型的数据怎么存储!

在大模型时代,AI 的训练与推理已经不再是单纯的算力问题。随着模型参数规模进入百亿级、数据量级扩展到 TB~PB,数据管线与存储架构往往成为影响训练速度的决定性因素。

2026-03-26 10:18:09 401

原创 一文搞懂大模型的发展历程!

大模型的发展并不是一蹴而就的,它有一条清晰的演变路线,从早期的词向量到如今的万亿参数大模型,每一步都在推动AI能力的边界。

2026-03-26 10:17:03 332

原创 学了大半年大模型应用开发,整理了这份路线图

学习过程中做了大量笔记,打算整理成系列发出来。这篇是总路线图,先把整个知识体系的脉络理一遍。

2026-03-26 10:16:17 386

原创 Java程序员如何借力AI突围:从CRUD到智能开发的转型指南

对Java开发者而言,AI不是威胁,而是杠杆——利用现有工程化经验,叠加AI能力,可以打开更高价值的职业路径。

2026-03-25 15:41:31 408

原创 Java+RAG开发手册:从文档处理到生成优化的完整代码实现

本文将深入探讨如何利用Java生态系统结合RAG技术,从原理到实践,手把手带你构建一个完整的智能问答系统。

2026-03-25 15:40:51 419

原创 AI如何学会“翻墙查资料”?深度解码RAG+MCP黑科技

本文深入探讨两大技术在信息实时性、知识精准度及多维度感知方面的突破性价值及其协同演进路径。

2026-03-25 15:40:18 288

原创 从Java到Agent开发:3个月转型指南,轻松掌握大模型应用核心能力

今天,就为大家带来一份专为Java开发者定制的3个月大模型Agent开发转型计划,从基础入门到企业级部署,全程干货拉满,帮你平稳过渡,实现技能升级!

2026-03-24 14:25:24 413

原创 大模型Prompt Prefill慢与首Token延迟优化:原理剖析与工程实践

随着RAG应用的普及和上下文窗口的扩展(从4K到128K甚至更长),长Prompt场景已成为常态,TTFT优化的重要性日益凸显。

2026-03-24 14:24:48 485

原创 传统Java开发者的AI逆袭:月薪从15K到30K的华丽转身

最近,我们对成都地区50多名Java开发者进行了深度调研,得到了一个让人震惊的数据:传统Java开发者中,已有60%开始转向AI应用开发,而他们的薪资普遍实现了增长。

2026-03-24 14:23:58 339

原创 2026年大模型微调框架全景指南

想要打造属于自己的AI助手?大模型微调是必经之路。本文为你梳理当前最主流的微调框架和平台,助你高效完成模型训练。

2026-03-23 10:30:28 618

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除