Llama-Turbo-CSDN博客

原创大模型学习文档+教程+PDF书籍+系统学习路线，一套全拿到！

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。事实上，抢你饭碗的不是AI，而是会利用AI的人。继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

2025-03-26 19:45:50 982 1

原创其实你往 LLM 里塞的东西，大部分都是垃圾

RAG 这条路走了这么多年，有一件事几乎没人当着台面说：我们检索回来的大部分内容，其实没有被真正用上。

2026-05-08 17:40:28 175

原创一文讲清：RAG到底是怎么工作的？（附简单实现思路）

RAG的核心思路可以一句话总结：在模型回答问题之前，先“查资料”，再回答。也就是不直接让LLM“凭记忆回答”，而是给它“开卷考试”，回答也就更贴近实际。

2026-04-22 14:03:52 371

原创大模型上下文都过百万了，我们为什么还需要 RAG？

长上下文不代表 RAG 消失了，它只是让 RAG 的重心从“如何切分”转向了“如何调度”。以下是构建高性能长上下文 RAG 系统的 5 个关键工程实践。

2026-04-22 13:53:30 375

原创 AI Agent 是什么？从 LLM、Tools、Prompt 理解 Agent 本质

Agent 的实质是什么？用 LLM + Tools + Prompt 三元素框架拆解 Agent 设计核心，涵盖模型选型、工具分类与 Skill 积累，帮你从「会用」升级到「会设计」。

2026-04-20 15:56:07 345

原创 AI Agent工程师是什么？能干嘛？需要哪些技能？一文说清楚

AI Agent赛道持续爆发，Agent工程师成为科技行业最炙手可热的新岗位。但这个岗位到底做什么？和普通程序员有什么区别？普通人如何入行？本文一次性说清楚。

2026-04-20 15:55:20 411

原创程序员转型大模型开发,可以转型成功吗？

程序员转型成为大模型（如深度学习或大规模语言模型）的开发者是完全可能的，尤其是随着人工智能领域的快速发展，这一领域的需求也在不断增长。

2026-04-17 11:17:59 214

原创 5款Embedding模型横评：中文RAG该选哪款？

我上周花了一周时间搭了个测试环境：5000篇中文技术文档，200个真实查询，5款Embedding模型挨个跑了一遍。

2026-04-14 10:16:57 545

原创 AI Agent任务完成率从41%到92%：3种架构怎么选

今天这篇，帮你搞清楚三种主流Agent架构到底怎么选。

2026-04-14 10:16:27 381

原创本地部署大模型全指南：从 Ollama 到 vLLM，性能差距有多大？

Google 在 Hugging Face 发布了 Gemma-4 31B， 5 天内下载量突破 67 万次。几乎同时，阿里的 Qwen3.5 27B 也以日均 50 万次的下载量霸榜。

2026-04-10 11:17:04 606

原创一文看懂Transformer：小白也能看懂

这段时间忙于项目，断更了一段时间，借着节假日下暴雨的时间，给大家奉上一篇AI 原理篇白话版文章。

2026-04-10 10:39:29 176

原创中年程序员想破局？转型大模型，为啥是当下最靠谱的路？

还记得几年前互联网行业流传的那些段子吗？35岁以上的程序员成了企业“优化”名单上的常客，理由似乎很“充分”——IT技术迭代如同翻书，年纪稍长便被贴上“学习慢、精力差、熬不动夜”的标签。

2026-04-08 10:23:38 356

原创大模型不是短期热潮，而是产业新地基！30+程序员抓住AI转型，就是握住下一个十年的职业主动权

2025年，随着AI代码生成工具在企业级开发中渗透率突破60%，传统CRUD岗位招聘需求同比缩减28%，不少资深程序员陷入职业焦虑。

2026-04-08 10:22:37 442

原创高阶RAG技巧：探索提升RAG系统性能的不同技巧

本文讨论了我们可以应用的各种高级技术来提高 RAG 系统的性能。这些技术可以应用于 RAG 流水线的各个阶段

2026-04-07 10:06:02 204

原创大数据秋招面试总结：大模型微调技术概要

随着大模型的迅速发展，笔者在刚经历的秋招面试中，深感会大模型已经从原来的加分项变成了如今的必须项。

2026-04-07 10:05:24 229

原创从0到1开发一个商用 Agent（智能体）

接下来，将结合实际Demo，从整体架构到核心模块的实现，完整展现一个多Agent协同系统的开发过程。

2026-04-03 11:08:58 338

原创从“聊天工具“到“数字徒弟“：一文看懂什么是 AI Agent

程序员给大模型写了一整套"外部代码框架"。框架里提前写好：怎么调搜索引擎、怎么读本地文件、怎么点邮件的"发送"。

2026-04-03 11:08:12 385

原创从被动唤醒到主动守望：基于AI Agent的智能任务架构实践

本文将分享AI Agent团队在“小高老师 AI Agent”中如何构建一套可感知、可交互、可管理的智能任务框架，探讨从技术选型到架构演进的全链路迭代。

2026-04-01 10:55:16 401

原创 RAG存在的问题及解决方案

今天给大家梳理一篇核心论文📝《Seven Failure Points When Engineering a Retrieval Augmented Generation System》中提到的RAG七大核心痛点，搭配对应解决方案，干货满满✨，建议收藏！

2026-04-01 10:54:32 351

原创一文学会如何构建无向量 RAG 系统

本文将构建一个无向量的、基于推理的 `RAG` 系统，使用分层页面索引。文档被转换为树结构，`LLM` 在树中推理以找到答案。无需嵌入。无需相似性搜索。

2026-03-31 11:19:01 178

原创一文搞懂 RAG，手把手搭智能问答助手

在没有 RAG 的时候，大模型生成内容的方式，说穿了就是 “闭卷考试”—— 全靠自己脑子里的 “老底” 硬拼。

2026-03-31 11:18:28 238

原创 RAG 必看！检索不准？全靠 rerank 救场

RAG系统中, 检索(retrieval)步骤完成之后, 可以从矢量数据库中根据相似性, 把相关的文档切片读取出来, 而文档切片的相关性排序, 对于最终的生成结果, 影响很大.

2026-03-30 10:18:21 254

原创 RAG 2.0 时代：从检索增强到主动推理的演进之路

RAG 2.0 不是终点,而是起点。随着 LLM 能力持续提升,我们将看到更智能、更自主的 AI 系统,而 Agentic RAG 正是通往这个未来的桥梁。

2026-03-30 10:17:46 380

原创 Qwen2.5 全系列的本地部署配置清单，你的电脑配置够用吗？

Qwen2.5 全系列的本地部署配置清单，你的电脑配置够用吗？

2026-03-30 10:17:09 744

原创 RAG技术深度解析（四）：召回与重排技术实战指南

本篇进入在线检索环节——当用户提出问题后，系统如何在毫秒级从百万文档中找到最相关的证据，又如何把"大致相关"精炼为"精准匹配"。

2026-03-29 08:00:00 295

原创 RAG技术深度解析（三）：向量数据库与索引优化实战

在上一篇文章中，我们掌握了文档分块和向量化技术。但向量化之后的数据该怎么存？怎么快速找到？本篇将深入索引算法和向量数据库——它们决定了RAG系统"找得快不快、找得准不准"。

2026-03-28 10:30:24 178

原创 RAG技术深度解析（二）：文档分块与向量化技术详解

本篇将深入离线阶段的两大核心技术——文档分块和向量化，它们决定了RAG系统检索质量的上限。

2026-03-28 10:29:22 240

原创 RAG技术深度解析（一）：基础概念与系统架构

在AI大模型时代，ChatGPT经常"一本正经地胡说八道"，企业内部知识文档却无法被利用。如何解决？答案是RAG技术——让AI从"只会背书"变成"会查资料"的智能助手。

2026-03-28 10:28:32 358

原创开源|RAG知识库如何搭建？企业 AI 知识库搭建全流程

RAG 技术通过检索 + 生成的双重逻辑，先从企业私有知识库中检索相关知识，再让大模型基于检索到的精准信息生成回答，完美结合了企业知识的专业性和大模型的语言生成能力。

2026-03-27 15:12:50 435

原创卷完提示词卷上下文，2026年卷“赛道“：AI程序员时代来了

OpenAI说，这个实验的目的不是炫技。他们想知道一件事：AI程序员到底需要什么环境，才能大规模可靠地工作？

2026-03-27 15:12:20 337

原创一文搞懂训练大模型的数据怎么存储！

在大模型时代，AI 的训练与推理已经不再是单纯的算力问题。随着模型参数规模进入百亿级、数据量级扩展到 TB~PB，数据管线与存储架构往往成为影响训练速度的决定性因素。

2026-03-26 10:18:09 401

原创一文搞懂大模型的发展历程！

大模型的发展并不是一蹴而就的，它有一条清晰的演变路线，从早期的词向量到如今的万亿参数大模型，每一步都在推动AI能力的边界。

2026-03-26 10:17:03 332

原创学了大半年大模型应用开发，整理了这份路线图

学习过程中做了大量笔记，打算整理成系列发出来。这篇是总路线图，先把整个知识体系的脉络理一遍。

2026-03-26 10:16:17 386

原创 Java程序员如何借力AI突围：从CRUD到智能开发的转型指南

对Java开发者而言，AI不是威胁，而是杠杆——利用现有工程化经验，叠加AI能力，可以打开更高价值的职业路径。

2026-03-25 15:41:31 408

原创 Java+RAG开发手册：从文档处理到生成优化的完整代码实现

本文将深入探讨如何利用Java生态系统结合RAG技术，从原理到实践，手把手带你构建一个完整的智能问答系统。

2026-03-25 15:40:51 419

原创 AI如何学会“翻墙查资料”？深度解码RAG+MCP黑科技

本文深入探讨两大技术在信息实时性、知识精准度及多维度感知方面的突破性价值及其协同演进路径。

2026-03-25 15:40:18 288

原创从Java到Agent开发：3个月转型指南，轻松掌握大模型应用核心能力

今天，就为大家带来一份专为Java开发者定制的3个月大模型Agent开发转型计划，从基础入门到企业级部署，全程干货拉满，帮你平稳过渡，实现技能升级！

2026-03-24 14:25:24 413

原创大模型Prompt Prefill慢与首Token延迟优化：原理剖析与工程实践

随着RAG应用的普及和上下文窗口的扩展（从4K到128K甚至更长），长Prompt场景已成为常态，TTFT优化的重要性日益凸显。

2026-03-24 14:24:48 485

原创传统Java开发者的AI逆袭：月薪从15K到30K的华丽转身

最近，我们对成都地区50多名Java开发者进行了深度调研，得到了一个让人震惊的数据：传统Java开发者中，已有60%开始转向AI应用开发，而他们的薪资普遍实现了增长。

2026-03-24 14:23:58 339

原创 2026年大模型微调框架全景指南

想要打造属于自己的AI助手？大模型微调是必经之路。本文为你梳理当前最主流的微调框架和平台，助你高效完成模型训练。

2026-03-23 10:30:28 618

空空如也

空空如也