AI大模型-搬运工-CSDN博客

原创大语言模型(LLM)入门学习路线图，从零基础到精通，理论与实践结合的最佳路径！_llm算法学习

Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。

2025-05-15 21:39:23 1111

原创别太天真！RAG若只是文档灌Dify，那要工程师做什么？

在AI技术日新月异的今天，我们对智能助手的期待已经远远超出了简单的问答。你是否曾好奇，为什么有些AI回答精准流畅，而有些却显得答非所问？答案或许就在RAG（Retrieval-Augmented Generation，检索增强生成）——一种正在悄然重塑AI能力的技术。如果你以为RAG只是“把文档丢进Dify”那么简单，那可能就低估了它的复杂性。今天，我们不仅要揭开RAG的核心原理，还要深入解析其中一个关键但常被忽视的环节——分块策略。毕竟，AI要想回答得好，喂它的信息得先切得合适，而这一点，远比想象中更讲究

2025-05-15 21:32:57 680

原创浙江大学：从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例｜附61页文件下载

根据报告的内容，本文主要概括了以下几个关键点：1、大模型推理能力快速提升：从早期的基于规则的少量数据处理，到模仿人脑进行大量数据的标记和训练，再到对人类学习过程的重点关注，大模型经历了多个发展阶段。2022年，ChatGPT的发布标志着对话式AI进入大众应用阶段。2023-2024年，OpenAI的o系列模型和DeepSeek-R1等模型在数学和代码推理任务上取得了突破性进展。

2025-05-10 16:37:38 1005

原创大模型时代下的智能体：从数据处理到复杂决策的“超级AI助手”

智能体（Agent）是一个具有智能的实体，能够感知环境、制定决策并采取行动以实现特定目标。一般具有记忆、规划、采取行为、使用工具等基本能力。智能体通常被设计成具有自主性和适应性，能够在不确定、复杂或动态的环境中做出决策以达成特定目标。

2025-05-10 12:00:56 676

原创被这本书硬控三小时，神作！！！推荐大模型书籍|《扩散模型从原理到实战》

就在几年前，“通用人工智能”(Artificial General Inte11igence，AGI)似乎还是一个只存在于科幻小说中的概念，在现实中的实现方法仍在探索中。然而到了2022年，基于大语言模型的AIGC(AI Generated Content)领域的快速发展，使得通用人工智能不再那么遥不可及。研究人员发现，当参数量超过某个值时，基于大语言模型的AIGC系统就能够理解人类用自然语言发布的指令并对应生成真实、高质量的文本、图像、音视频等多模态数据扩散模型便是其中引人往目的先行者。本书将详细

2025-05-09 22:00:35 1304

原创 Dify - 部署高可用私有化系统指南_dify私有化部署

文件中配置了 Dify 部署的总体结构，包括：几个 Dify 自身工程（api、web、 work、sandbox等），还有 Dify 的一些依赖（nginx、PostgreSQL、Redis、罗列了各类向量数据库），具体结构可以参考。无论是多节点的服务组件，还是高可用的底层存储系统，均能确保在高并发场景下稳定运行。包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2025-05-09 21:53:19 742

原创大模型不再是博士生高端局，核心代码被开源（附开源项目+pdf书籍教程）

当各大高校还在用他的著作手搓大模型时，威斯康辛大学终身教授反手把价值百万美元的工业级训练代码甩上开源社区github，狂揽4万星标，100万行核心代码直接开源。硬生生把大模型训练从博士生高端局变成小白都能跑的入门运动。它的目的很简单，就是甚至有我奶奶跟着教程都能训个模型出来跟着他的这本**《从零构建大模型》书籍教程以及项目来，**全套【中英版书籍PDF+项目资源】已经整理好，还有完整版的大模型 AI 学习资料，朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】

2025-05-08 13:40:15 936

原创一键私有化部署Dify，轻松搞定 AI 智能客服机器人

通过 Dify 平台，我们可以轻松实现 AI 智能客服机器人的私有化部署 😎。只需简单的几步操作，就能搭建出一个功能强大的智能客服系统，为用户提供更加优质的服务 🤗。还等什么，赶紧动手试试吧！

2025-05-08 13:35:12 682

原创 2025年大模型平台落地实践研究报告｜附75页PDF文件下载

本报告旨在为各行业企业在建设落地大模型平台的过程中，提供有效的参考和指引，助力大模型更高效更有价值地规模化落地。本报告系统性梳理了大模型平台的发展背景、历程和现状，结合大模型平台的特点提出了具体的落地策略与路径，同时详细分析了大模型平台的关键能力及其建设要点，并对多个行业的落地案例进行了深入剖析，最后对大模型平台的发展趋势进行展望。

2025-05-07 20:37:05 541

原创实战指南：从零构建 MCP 架构下的 Agentic RAG 系统，无第三方MCP Server

五一期间，小编尝试用MCP架构从零实现一个完整的Agentic RAG系统，以演示MCP与RAG、Agent的一些有趣融合，在此与大家一起分享。内容涵盖：思考：MCP与Agentic RAG的融合MCP标准下的Agentic RAG架构MCP服务端：实现RAG-Server（LLamaIndex）MCP客户端：实现Agent（LangGraph）端到端效果演示

2025-05-07 20:34:40 740

原创【大模型入门必看】八本高评分书籍，大家都在读！

在AI技术日新月异的时代，掌握大模型开发与应用的技能已成为科研人员与工程师的必备能力。本文为读者精心挑选了8本高评分的书籍，从基础理论到实际操作，为不同层次的学习者提供了全面的学习资源。这些书籍包括对PyTorch深度学习、LLM构建、AIGC基础、大模型应用和技术演进的深入解读，助力读者在大模型时代顺利前行。

2025-05-06 11:13:27 877

原创 Llama 3.1部署教程（非常详细）从零基础入门到精通，看完这一篇就够了

Meta公司发布了人工智能模型——Llama 3.1。那么Llama 3.1 405B的效果怎么样？我们来对比一张图，横向对比一下GPT-4。可以看出，Llama 3.1 405B在各类任务中的表现可以与GPT-4等顶级的模型相差无几。那么，我们怎样才能用到这款强大的Llama 3.1 405B模型呢？最直接的方式是通过Meta.ai平台，但目前这一途径仅对美丽国的用户开放。那有无适合平民用的大模型嘞。接下来我们将在本地部署Llama 3.1 8B（环境所迫）1.环境准备。

2025-05-06 11:10:30 867

原创 2025最新AI大模型学习路线：（非常详细）AI大模型学习路线，收藏这一篇就够了！

在大模型时代，我们如何有效的去学习大模型？现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。掌握大模型技术你还能拥有更多可能性• 成为一名全栈大模型工程师，包括Prompt，LangChain，LoRA等技术开发、运营、产品等方向全栈工程；• 能够拥有模型二次训练和微调能力，带领大家完成智能对话、文生图等热门应用；

2025-05-06 11:01:25 783

原创 RAG技术解剖：3大模块根治AI“幻觉“

RAG（Retrieval Augmented Generation，检索增强生成）是一种将检索系统与生成式AI模型结合的技术架构。不要让模型凭空生成答案，而是先检索相关信息，再基于检索到的信息生成回答。RAG技术通过将检索系统与生成式AI模型结合，有效解决了大模型的知识时效性、专业领域知识缺乏、幻觉和可溯源性等问题。它为构建可靠、准确、透明的AI应用提供了强大支持。对于我们技术开发者来说，掌握RAG不仅是学习一项技术，更是培养一种思维方式——如何让AI系统更加开放、透明、可控和可信。

2025-05-06 10:59:34 716

原创一个很恶心，但能让你6周学透大模型的方法!

今天给大家推荐一个很恶心，但，快速吃透大模型！！相信通过为期💪。

2025-05-01 10:30:00 112

原创 Dify 入门与工作流节点介绍

Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务（Backend as Service）和 LLMOps 的理念，使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员，也能参与到 AI 应用的定义和数据运营过程中。由于 Dify 内置了构建 LLM 应用所需的关键技术栈，包括对数百个模型的支持、直观的 Prompt 编排界面、高质量的 RAG 引擎、稳健的 Agent 框架、灵活的流程编排，并同时提供了一套易用的界面和 API。

2025-04-23 22:10:13 1306

原创上海交通大学力作！《动手学大模型》实战教程+PPT分享！

今天与大家分享一个由上海交通大学提供的珍贵资源——一套免费的大模型课程。，其受欢迎程度可见一斑，而且它还包含了全面的教程文档和精心制作的Slides，可以说在AI圈特热度很高了。《动手学大模型》是一套实践性极强的编程教程，它源自于，由知名专家精心设计。本教程的目标是提供一个深入浅出的大模型编程入门参考，通过一系列精心设计的实践案例，帮助有志于该领域的研究者迅速把握大模型的核心概念，并在课程设计和学术研究中发挥其潜力。特别推荐这套教程给那些希望在人工智能领域取得突破的研究者和学生。

2025-04-23 21:56:39 380

原创为什么一定要做Agent智能体？

最近一直在从事Agent智能体相关的工作，主要是聚焦在阿里云客户服务领域，。我们团队近一年多的时间一直在服务领域持续构建、深耕Agent能力，在这方面我本人也投入了大量的精力。或者换句话说，提出这个问题的人也挺多的，其实逻辑也并不复杂：同样的业务场景，使用Agent无非就是构建了一个基于大模型按多步骤执行的流程，如果通过传统的开发方法，如，其实也同样能实现类似Agent的流程功能。

2025-04-22 22:41:08 763

原创 DeepSeek、Manus与AI+Agent行业现状报告｜附52页文件下载

1、DeepSeek等推理模型对Al Agent的影响。2、Manus通用智能体带来的行业启示。3、AlAgent行业现状。4、AlAgent对如何影响企业经营。

2025-04-22 22:38:25 326

原创【大模型科普】智能体Agent的五种交互模式

octave如果你是零基础小白，想快速入门大模型是可以考虑的。一方面是学习时间相对较短，学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！😝有需要的小伙伴，可以保存图片到免费领取【保证100%免费】🆓。

2025-04-17 19:27:14 777

原创给大家普及一下学大模型需要达到的学习强度

无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2025-04-17 19:23:34 1104

原创大模型应用之RAG详解，RAG保姆级教程，收藏这篇就够了！_rag大模型

RAG（Retrieval Augmented Generation，检索增强生成）技术最初源于2020年Facebook的一篇论文——《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》。是的，2020年就已经提出了这项技术。这篇论文要解决的一个问题非常简单：如何让大语言模型使用外部知识进行生成。通常，预训练模型的知识是存储在参数中的，因此模型无法了解训练集之外的知识（例如搜索数据、行业知识）。

2025-04-16 22:15:49 1000

原创全网爆火神书《从零构建大模型》分享，一本书刚发布，就拿下33.2k个star？

从零构建大模型》是一本即将于今年10月底发布的书籍，github已经吸引了惊人的21.7k标星！作者是威斯康星大学麦迪逊分校的终身教授，在GitHub、油管、X上拥有大量粉丝，是一位真正的大佬。

2025-04-16 22:09:58 532

原创手把手教你用 DeepSeek + CherryStudio 打造本地知识库

CherryStudio 是一款支持多个模型提供方的客户端软件，最近雨飞也是一直在使用它，但是很多人只是用来进行简单的对话。其实 Cherry Studio 还可以用来搭建简易的本地知识库，今天就教大家如何使用和搭建这个知识库。官方网站：https://cherry-ai.com/安装过程非常简单，直接参考下方教程。1、配置硅基流动的模型服务和 API 密钥这一步可以参考文章：[全网首发，硅基流动 X 华为云，提供 DeepSeek R1 API 推理服务]2、配置模型。

2025-04-12 13:12:35 1077

原创 2025最新大模型常见面试题汇总（含答案），面试还得八股文，不背不行啊，非常详细收藏我这一篇就够了！

最近春招正在如火如荼地进行中，看到很多人的简历上都包含大模型相关的工作，各家大厂和初创都很舍得给钱，动辄百万年包也变得不再稀奇。因此在大模型纵横的这个时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。本文汇总了1、目前主流的开源模型体系有哪些？Transformer体系：由Google提出的Transformer 模型及其变体，如BERT、GPT 等。PyTorch Lightning：一个基于PyTorch的轻量级深度学习框架，用于快速原型设计和实验。

2025-04-12 13:09:45 1459

原创 Dify x DeepSeek：轻松部署私有化 AI 助手，搭建本地 DeepSeek R1+ 联网搜索 App_dify联网

如需切换访问端口，请参考此文档：https://docs.dify.ai/zh-hans/getting-started/install-self-hosted/faq#id-5.-ru-he-xiu-gai-ye-mian-duan-kou。通过私有化部署，你可以完全掌控数据的安全性，并根据自己的需求灵活调整部署方案，打造专属于你的。在实际应用中，当你上传内部文档或专业资料后， Dify 的知识库功能可以承担起 RAG 作用，帮助 LLM 基于专业资料提供更有针对性的解答，有效弥补模型训练数据的不足。

2025-04-11 21:29:19 952

原创 2025大模型新书分享《大模型入门：技术原理与实战应用》文末PDF共享

本书深入探讨大模型技术及其应用的书籍，特别聚焦于提示工程这一新兴领域。本书揭示了大模型的工作原理，展示了如何通过精心设计的提示引导大模型产出高质量内容，涵盖了从电子商务、创意营销到内容创作、智能办公、编程和软件生态等多个领域的实践案例，为读者提供了一个全面的技术科普和操作指南，帮助读者掌握与大模型高效协作的方法，挖掘大模型潜力，解决实际问题。

2025-04-11 21:27:31 962

原创 RAGFlow与Dify的关系

RAGFlow与Dify是两款定位互补的AI开发工具，两者既有差异化的核心能力，又可通过整合形成更强大的解决方案。

2025-04-09 21:46:28 929

原创瞬间对大模型的喜爱程度达到了1000000000%

从大模型时代开发者的基础技能出发，深入浅出地介绍了如何基于大模型 API、LangChain 架构快速开发结合大模型强大能力的应用。它不仅提供了深入的理论知识，而且还通过实践指导，帮助开发者将LLM技术应用于实际问题中。👩🏻‍💻宝子们，今天必须给大家安利一本超实用的书——第二部分搭建基于 ChatGPT 的问答系统。第九章评估（上）——存在一个简单的正确答案。第十章评估（下）——不存在简单的正确答案。第八章搭建一个带评估的端到端问答系统。第五章处理输入-思维链推理。第三章评估输入——分类。

2025-04-07 23:05:50 357

原创 Meta推出Llama 4：MoE构架、原生多模态、10M上下文，没有发布推理模型

这次Llama 4的推理模型还不见踪影，这多少有点说不过去，大家觉得呢？毕竟Meta也是妥妥的大厂啊！不过Meta 表示这只是开始，后续还有更多模型，团队正在全力开发中，特别提到了。

2025-04-07 22:34:58 820

原创零基础学AI大模型要多久？真的能学会吗？_训练一个ai模型要多久

随着人工智能技术的迅猛发展，AI大模型成为了当前最热门的技术领域之一。很多人对AI大模型既充满好奇又感到陌生，特别是对于那些完全没有编程基础的人来说，从零开始学习AI大模型似乎是一项艰巨的任务。但实际上，只要有足够的决心和正确的方法，任何人都有可能成为AI大模型领域的专家。本文将探讨从零基础学习AI大模型需要多长时间，以及如何确保你能够真正学会。

2025-03-28 23:01:13 993

原创 AI大模型实战系列：电动汽车充电行为大模型智能体框架解读_微调大语言预测电动汽车

随着电动车(EVs)变得更加流行，它们大规模融入电网带来了新的挑战和机遇。EV的充电行为对电网有着显著影响，因为它涉及大幅度的功率需求波动，影响电力系统的稳定性和经济效率[1]。

2025-03-28 22:59:36 846

原创 RAG+AI工作流+Agent：全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM_ragflow和dify的比较

开箱即用：支持直接上传文档、自动爬取在线文档，支持文本自动拆分、向量化、RAG（检索增强生成），智能问答交互体验好；无缝嵌入：支持零编码快速嵌入到第三方业务系统，让已有系统快速拥有智能问答能力，提高用户满意度；灵活编排：内置强大的工作流引擎，支持编排 AI 工作流程，满足复杂业务场景下的需求；模型中立。

2025-03-28 22:55:14 845

原创 2025火爆全网的LLM大模型教程：从零开始构建大语言模型，git突破18K标星

什么！一本书的Github仓库居然有18.5k的星标！（这含金量不必多说）对GPT大模型感兴趣的有福了！这本书的名字叫也就是虽然这是一本英文书、而且还没正式出版，但是他真的可以帮你使用python从零构建一个自己的大模型！为了加强读者的动手能力，这本书主要使用的是框架，而不是依靠各种库。通过这种方法，加上大量的图表和插图让大家可以彻底了解llm的工作原理。

2025-03-24 22:59:10 1036

原创【AI大模型】如何构建一个大模型？看完你就知道了！_ai大模型开发

这四个阶段都需要不同规模的数据集及不同类型的算法，会产出不同类型的模型，所需要的资源也有非常大的差别。图1 OpenAI 使用的大语言模型构建流程（Pretraining）阶段需要利用海量的训练数据（数据来自互联网网页、维基百科、书籍、GitHub、论文、问答网站等），构建包含数千亿甚至数万亿单词的具有多样性的内容。利用由数千块高性能 GPU 和高速网络组成的超级计算机，花费数十天完成深度神经网络参数训练，构建基础模型（Base Model）。

2025-03-24 22:51:21 845

原创 2025年最新AI大模型学习路线（非常详细）零基础入门到精通保姆级教程，收藏这一篇就够了！学完即就业！

大模型目前在人工智能领域可以说正处于一种“炙手可热”的状态，吸引了很多人的关注和兴趣，也有很多新人小白想要学习入门大模型，下面给大家分享一份2025最新版的大模型学习路线，帮助新人小白更系统、更快速的学习大模型！微信扫描下方二维码。

2025-03-23 12:57:06 903

原创亲手复现DeepSeek-R1-Zero实验完整解读

本文给大家分享个人亲手复现R1-Zero的全过程，包括对关键源码的解读、训练过程和实验结果分析。TL;DR，整个项目只需要定制2处地方：另外在main_ppo.py训练入口中的注册该reward function即可。如果想定制训练自己的推理任务，只需要处理上述两处代码即可。又可以愉快地调包了 (:中途遇到问题：模型和数据基于Qwen2.5-3B复现。下载作者上传的数据集Jiayi-Pan/Countdown-Tasks-3to4。数据集包括target和nums两列。此处要注意，veRL框

2025-03-23 12:43:06 1098

原创给GitHub排名No.1的LLM课程看跪了...

现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。2、LLM科学家阶段：深入研究最新技术，学习LLM的训练和优化，涵盖预训练、微调、强化学习等全流程。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2025-03-22 23:25:20 1029

原创手把手教你如何用扣子（COZE）打造一个企业级的知识库机器人_扣子(coze)

大模型是由海量数据训练而成的人工智能模型，具备强大的学习和推理能力，能够理解和生成自然语言。智能体则是基于对话的AI项目，它接收用户的输入，通过大模型自动调用插件或执行工作流完成指定任务。智能客服、虚拟助手、英语外教等，都是智能体的典型应用场景。扣子（COZE）是字节旗下的新一代AI应用开发平台。无论你是否有编程基础，都可以在扣子上快速搭建基于大模型的各类AI应用，并将这些应用发布到各个社交平台、通讯软件，甚至通过API或SDK集成到你的业务系统中。二、扣子能做什么？扣子提供了可视化设计与编排工具。

2025-03-21 15:05:00 1282

原创 2025打算转行AI大模型算法工程师，前景怎么样？_ai算法工程师怎么样

从ChatGPT到新近的GPT-4，GPT模型的发展表明，AI正在向着“类⼈化”⽅向迅速发展。GPT-4具备深度阅读和识图能⼒，能够出⾊地通过专业考试并完成复杂指令，向⼈类引以为傲的“创造⼒”发起挑战。现有的就业结构即将发⽣重⼤变化，社会⽣产⼒的快速提升将催⽣新的⾏业和岗位机会。如何与⼈⼯智能协同⼯作，利⽤AI辅助办公已经成为各⾏从业者的必修课。脉脉创始⼈兼CEO林凡认为，从“⼈⼯智障”向“⼈⼯智能”的进化节点，**是⼤模型的出现**。

2025-03-21 15:03:45 1082

空空如也

空空如也