大模型本地部署-CSDN博客

原创 coze功能详解！AI保姆级入门教程！

本地文档包含三种：1、文本格式：word, pdf, txt2、表格格式：excel, csv3、照片类型以上传本地文档为例，上传后，选择自动分段与清洗，coze会自动对数据进行处理上传后，我们在bot或工作流中，就能使用该知识库。

2025-01-04 17:32:07 17827 2

原创没钱买GPU！本地还想跑大模型的终极工具Ollama！

Ollama 是一个开源平台，它允许我们在本地机器上轻松设置和运行 LLM。它简化了下载、安装和与 LLM 交互的过程。至少应该有 8 GB内存的 Intel i5处理器才能运行7B型号，如果需要运行13B 的型号CPU起码得至少需要16 GB 的是i5。以此类推32 GB 的 RAM 来运行 33B 型号。

2024-11-22 17:30:34 9949

原创大模型训练（超全面！超详细！）收藏这一篇就够了！

大模型训练被分解成了预训练，监督调优，对齐等阶段。先看预训练，预训练，即Pre-training。预训练的目的是让模型学习语言的特性，主要是学习语言表达的流畅性和规则。至于具体的语言任务，比如对话，角色扮演，信息抽取，翻译，阅读理解，问答等，则需要放到监督调优。预训练是大模型的基础和核心，预训练阶段决定了模型的基础能力和上限。

2024-09-23 15:27:15 5375

原创一键部署本地私人专属知识库，开源免费！可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型，零代码集成。

今天跟大家分享的内容是，如何在本地搭建自己的本地知识库问答系统MaxKB，与其他问答知识库相比，他真正做到了开箱即用，零代码集成，支持ChatGPT、百度千帆、Lama2、Lama3，通义千问等几十种大语言模型，操作界面简介，小白也能快速上手。【注意在正式搭建知识库问答系统之前，请确保你的Windows系统已经升级到了专业版本，同时拥有一张独立的显卡！！】

2024-06-13 17:24:12 5160 1

随即引爆社交网络，大模型行业进入加速发展阶段。国外基础模型实力强劲、不断精进，开源模型打造庞大应用生态，端侧模型小而美。国内大模型也进入加速成长期，在过去一年中取得了实质性突破。百度文心一言、讯飞星火、清华智谱、商汤“日日新”整体表现逼近，开源模型快速进步，文生视频、文生音乐等多模态也取得突破。国内大模型网页流量和应用下载量节节攀升，大模型已经成为日常生活中的重要助手。。国外大模型主要分为三个层级：性能强劲的闭源模型，具备生态优势的开源模型，以及专注端侧应用的轻量模型。

2024-05-17 15:01:07 7051 1

原创什么是大模型？一文读懂大模型的基本概念

什么是大模型？一文读懂大模型的基本概念

2024-04-18 09:57:13 5797

原创作为普通程序员，我们该如何学习大模型（LLM），学习路线和知识体系

原谅我的后知后觉，才开始从头写，我是已经上了一阶段大模型的课，也搜集了些资料，并自己做了小部分实践，回过头来，才想开始整理些文章。起初，大家都在写，都在发，我那会在焦虑。自chatgpt爆火以来，AI技术又被广泛关注，国内外各大厂商也纷纷布局，作为我们每一个普通人，也无不时刻感受着AI一波又一波的冲击。尤其是作为程序员的我，相信绝大多数程序员也有和我一样的感受，从一开始的新奇，到焦虑，到试图去了解他，到去尝试，并致力于应用。

2024-04-12 11:19:13 9639

原创大模型部署工具 llama.cpp 介绍与安装使用

另外一个是量化，量化是通过牺牲模型参数的精度，来换取模型的推理速度。llama.cpp 提供了大模型量化的工具，可以将模型参数从 32 位浮点数转换为 16 位浮点数，甚至是 8、4 位整数。训练的过程，实际上就是在寻找模型参数，使得模型的损失函数最小化，推理结果最优化的过程。训练完成之后，模型的参数就固定了，这时候就可以使用模型进行推理，对外提供服务。大模型时代，企业对人才的需求变了，AIGC相关岗位人才难求，薪资持续走高，AI运营薪资平均值约。llama.cpp 提供了模型量化的工具。

2024-04-07 18:31:27 11225

原创扣子Coze实战必备｜万能免费文生视频的剪映小助手指南（建议收藏）

最近书单、火柴人、小人国美食等视频火爆全网，这类文生视频怎么做的？话不多说，直接上货！今天给大家分享万能免费文生视频的核心流程：如何使用Coze+剪映插件+剪映小助手+剪映，将文案直接生成可以发布使用的爆款视频。学会了这个流程，就等于掌握了书单、火柴人、小人国美食等爆款视频的核心功法，不仅能自己创作，而且还可以自由发挥！

2025-06-12 14:38:20 402

原创一文读懂 Multi Agents 系统【大模型行业应用入门系列】

随着人工智能技术的不断发展，越来越多复杂的应用场景对单一智能体的能力提出了更高的要求。单个智能代理在处理复杂任务时面临着局限性，难以满足实际需求。这便催生了“Multi Agents(多智能体)系统”的兴起。

2025-06-12 14:32:05 238

原创彻底搞懂 MCP 是什么、和 API 的区别、对企业的价值，如何在企业落地、未来趋势

AI 每天都在变得越来越智能，但 AI 模型只能处理它们所训练的数据，这意味着它们通常不知道现实世界中发生了什么，比如你的 Google Drive、Notion、飞书文档或者百度网盘里有什么。为了解决 AI 和第三方系统的数据交互问题，Anthropic（Claude背后的公司）开发了一种模型上下文协议（MCP）。

2025-06-11 15:28:28 602

原创什么是AI提示词工程？一文读懂Prompt Engineering的原理、结构、进展与实用技巧

在 AI 技术飞速发展的今天，大语言模型（LLM, Large Language Model）如 ChatGPT、Claude、Gemini、DeepSeek 等逐渐成为开发者手中的得力工具。但你是否发现，同样的问题，不同的提问方式会让 AI 的回答质量大相径庭？这背后起关键作用的，正是一项被称为提示词工程（Prompt Engineering）的技术。本文将深入探讨提示词工程的原理、常见结构、技术进展以及实用优化技巧。

2025-06-11 15:16:15 702

原创什么是AI Agent？从聊天机器人到智能助手的进化

在人工智能快速发展的今天，我们正在见证一场从传统聊天机器人到AI Agent的重大技术革命。就像生物在漫长的历史中不断进化一样，AI技术也在经历着令人激动的进化过程。

2025-06-10 14:50:50 931

原创 2025新一代人工智能技术发展及其应用报告（附下载，111页）

2025 年 4 月 9 日，中国工程院院士、西藏大学信息科学技术学院教授尼玛扎西带来了一场名为 “2025 新一代人工智能技术发展及其应用” 的报告，为我们揭开了新一代人工智能神秘面纱，让我们得以窥探技术浪潮下生活的种种变革与社会发展的全新图景。新一代人工智能绝非是简单技术迭代，而是全方位重塑世界的力量，它深度融合算力、算法与数据，驱动各行业迈向智能化新阶段，深度嵌入教育、科学、生活、政务等领域，重塑行业生态，改变职业格局。这不是科幻畅想，而是触手可及的未来。

2025-06-10 14:47:44 760

原创 2025年大模型架构创新研究报告｜附30页PDF文件下载

量子位智库权威报告揭示AI架构变革浪潮，2025年6月，中国领先的人工智能研究机构量子位智库(QbitAI Insights)发布了《2025大模型架构创新研究报告》，这份30页的重磅报告由资深分析师王昕祎领衔，系统梳理了当前AI领域最前沿的架构创新趋势。报告指出，自2017年Transformer架构问世以来，AI行业首次面临全面的架构范式革新，这场变革将决定未来5-10年人工智能技术的发展方向。

2025-06-09 15:57:33 574

原创 LangGraph实战教程：构建会思考、能记忆、可人工干预的多智能体AI系统

通过组合几个较小的子智能体来创建强大的 AI 智能体已成为一种趋势。但这也带来了挑战，例如减少幻觉、管理对话流程、在测试期间密切关注智能体的工作方式、允许人工介入以及评估其性能。你需要进行大量的反复试验。

2025-06-09 15:19:59 1238

原创【RAG入门系列】⼀⽂读懂 RAG 技术:给⼤模型外挂“知识库”

你有没有想过，为什么现在的AI能回答那么多问题？是不是它真的“无所不知”？其实不然。虽然大语言模型（LLM）已经非常强大，但它也有“盲区”⸺比如知识更新不及时、容易编造答案等。那怎么办呢？别急，今天我们要介绍⼀个强大的技术⸺检索增强生成（RAG），它就像给AI装了⼀个“图书馆”，让它在回答问题前先查资料，确保答案准确可靠！

2025-06-07 15:00:59 636

原创德勤：2025年AI应用案例精选报告｜附94页文件下载

报告通过深入剖析六大行业（消费行业、能源资源与工业、金融服务业、政府与公共服务、生命科学与医疗保健、技术媒体与电信）中数十个引人注目的AI应用案例，展示了人工智能在不同商业场景中的创新实践与价值创造。报告不仅总结了AI在各行业的应用现状，还探讨了未来的发展趋势与潜在影响，为不同阶段的AI从业者、企业决策者以及行业领导者提供了宝贵的参考与启

2025-06-07 14:55:26 638

原创【深度报告】AI Agent重构医疗行业：从辅助工具到智能诊疗全流程革命

中国医疗体系正面临两大核心挑战：

2025-06-06 15:05:14 706

原创 AI大模型落地现状：九个行业的真实变革图景

嘿，各位“AI办公前沿”的老朋友们，今天咱们不整那些虚头巴脑的，聊点实在的。AI大模型这玩意儿，不再是科幻小说里的情节，也不是科技大佬们PPT上的远方。它就像初夏的雨，悄无声息，却已经渗透到了我们工作和生活的方方面面。有些变化，可能你已经感觉到了，有些，或许还在水面之下酝酿。

2025-06-06 14:57:23 939

原创 2025年中国AI大模型产业市场前景及投资研究报告

AI大模型是指在机器学习和人工智能领域中，具有庞大参数量和复杂结构的模型。这些大模型不仅能够提高企业的工作效率，还能够推动整个行业的创新和发展。近年来，AI大模型的应用场景也越来越广泛，从智能家居到智慧医疗，从智慧城市到智能制造，大模型已经成为了人工智能技术的重要组成部分。

2025-06-05 15:32:12 626

原创大模型推理底层逻辑：Agent开发者必须掌握的七大推理场景五大技巧！

在AI技术飞速发展的当下，Agent开发者既遭遇挑战，又迎来了无穷的机遇。怎样从海量的数据里精准提炼出关键信息？怎样让Agent更智能地领会用户意图并做出回应？这所有问题的答案，都蕴含在模型推理的底层逻辑当中。本文会为你详细剖析Agent开发者必不可少的7大推理场景与5大实用技巧，助力你在AI的浪潮中崭露头角。

2025-06-05 15:19:32 434

原创 Dify、n8n、Coze 深度对决：企业级 AI 场景应用落地，谁是终极答案？

在 AI 应用井喷的 2025 年，快速搭建智能自动化工作流、高效落地 AI Agent 已成为开发者和企业的核心诉求。面对市面上三大主流平台——n8n、Dify、Coze——各自瞄准不同场景，选择困境随之而来：

2025-06-04 15:18:44 1174

原创智能体快速入门，一文讲清楚60个AI Agent术语

一种能够感知环境、进行推理、做出决策并执行动作以实现特定目标的自主计算实体。它不仅仅是一个程序，更是一个具备一定智能体性的系统，其工作流程是一个感知-思考-行动的闭环。例如，一辆自动驾驶汽车通过摄像头、雷达、激光雷达等感知器获取路况信息，然后通过其内置的AI系统进行决策（如加速、减速、转向），并通过执行器（如油门、刹车、方向盘）实际执行这些行动，以实现在道路上安全行驶的目标。

2025-06-04 15:14:41 929

原创最新！一文带你读懂，扣子（Coze）怎么搭建工作流?

在扣子（Coze）平台中，工作流是指将多个任务或操作按顺序和逻辑进行组合，通过自动化的方式来处理复杂的业务场景。每个工作流包括多个节点，每个节点可以包含具体的操作、任务或处理步骤。通过这种方式，工作流能够使不同的工具、插件及模型协同工作，以便实现更高效、更准确的任务执行。

2025-06-03 17:05:07 886

原创全网最强！一文读懂AI大模型中的Agent技术

AI Agent（智能体）是基于LLM（大语言模型）构建的具备环境感知→决策推理→行动执行完整能力链的智能系统。Agent能够模拟独立思考过程，灵活调用各类工具，逐步达成预设目标。与单纯的语言模型相比，其核心特征在于：

2025-06-03 17:03:09 993

原创大模型最易懂、最漂亮的PPT讲解（完整版）（介绍篇、使用篇、开发篇、扩展篇、应用篇、展望篇）

一共包含六个篇章（介绍篇、使用篇、开发篇、扩展篇、应用篇、展望篇）

2025-06-02 11:45:00 808

原创 AI时代一定要学的大模型工具：Ollama，详解安装、命令与使用指南

Ollama 是一个轻量级的开源工具，允许你在本地运行各种大语言模型（LLM），包括支持加载和运行不同的 LLaMA 模型（如 7B、13B 和 70B 参数版本）。Ollama还提供命令行界面（CLI）和Python API，这意味着开发者可以方便地集成到自己的项目中。同时，文档提到它支持量化等技术，这可能帮助减少内存使用并提高模型在旧设备上的运行效率，这对资源有限的环境特别有用，是AI应用中非常有用的工具。

2025-06-02 09:45:00 1142

原创一文详解RAG的5步流程和12个优化策略，看这一篇就够了！

ChatGPT、GLM等一众生成式人工智能在文本创作及文本至图像转换等领域，展现出了令人瞩目的能力。然而，这些尖端技术亦非尽善尽美，其固有的局限性如同暗礁，潜藏着诸如生成内容的虚幻性、解释性的缺失、专业知识的浅薄，以及对时代新知把握的不足等问题。为了跨越这些障碍，提升模型的效能，研究者们探索出两条主要路径：一是通过微调（Fine Tune）技术，让模型在既有基础上进一步精进；二是赋予模型与外界交互的能力，使其能够以多元的方式汲取新知。微调技术，无疑如同一把锐利的手术刀，能够精准地雕琢模型，使其深谙私域知

2025-05-31 10:15:00 844

原创清华大学64页PPT：普通人如何抓住DeepSeek红利（附下载）

清华大学发布的《普通人如何抓住DeepSeek红利》报告（64页版）为普通人提供了在AI时代利用DeepSeek平台实现个人成长与发展的具体方法和策略。报告详细阐述了如何使用 DeepSeek 解决工作中的项目书写作、新员工熟悉公司情况、日常客户沟通等问题，以及在学习、生活和社交关系中如何应对各种挑战。通过合理使用 DeepSeek，普通人可以提高工作效率、提升学习能力、改善生活质量和处理。

2025-05-31 09:00:00 820

原创 2025-2026年中国智算一体机行业研究报告｜附60页PDF文件下载

技术演进‌全球算力需求爆发式增长，传统计算模式难以应对实时数据处理、多模态交互及复杂决策任务，智算一体机通过“端-边-云”协同架构，集成算力硬件、智能算法与垂直场景，成为数字化转型核心基础设施。

2025-05-30 14:23:57 669

原创【初学者必看】从零到一：搭建你的第一个RAG应用实战（极简版）

本节将带领您使用一个易上手的框架——LlamaIndex，快速搭建并运行一个最基础的RAG应用。我们的目标是体验RAG从数据加载、索引构建到查询响应的核心流程，而不是构建一个生产级应用。

2025-05-30 14:18:56 1052

原创一键部署2000多种AI大模型！不挑环境、不吃配置，神了！

未选择任何文件new在数字化的浪潮中，**Ollama**如同一位技术界的“魔法师”，挥舞着它的魔杖——一行简单的命令，就能唤醒沉睡的代码巨人，一键本地部署**2000+**大模型！今天，让我们揭开Ollama的神秘面纱，一探究竟。## **一、Ollama：AI“魔法师”**Ollama，它是一个轻量级、可扩展的大模型框架，就像是一位能够召唤各种大语言模型的魔法师。它不仅支持Windows、Linux、MacOS这些主流操作系统，还拥有一个庞大的模型库，包括Qwen、Llama等2

2025-05-29 16:24:03 566

原创 2025 年《AI 产品经理学习指南》：这 100 个核心知识点，你必须全掌握！

在人工智能（AI）技术日新月异的 2025 年，AI 产品经理已成为推动 AI 技术落地、实现商业价值的关键角色。这一岗位不仅要求具备传统产品经理的技能，更需要深入理解 AI 技术，能够在技术与业务之间架起桥梁。为了帮助有志于成为 AI 产品经理或正在该岗位上探索的人士，我们精心梳理了 100 个核心知识点，这些知识点涵盖了 AI 技术基础、产品设计、项目管理、商业洞察等多个关键领域，是你在 AI 产品经理之路上的必备指南。

2025-05-29 16:20:29 1347

原创北京航空航天大学：2025工业大模型白皮书（免费下载）

在智能化浪潮中，制造业正经历着前所未有的变革。《2025工业大模型白皮书》带来了一束新的光芒。这份凝聚了北航与蚂蚁工场等顶尖团队心血的报告，是工业智能化的启明星，照亮了前行的道路。书中详尽的分析与洞察，层层剖析了工业大模型的现状与未来，不仅深入探讨了其独特的技术体系，更是精准点出了当前面临的关键挑战。这不仅是一份对工业大模型的全面解读，更是献给所有致力于推动工业进步人士的珍贵指南。它将激发我们对未来无限可能的想象，引领我们踏入一个全新的智能制造时代。

2025-05-28 16:10:55 293

原创提示工程实战指南：从Zero-Shot到Graph Prompting，7大核心技术全解析

随着大型语言模型(LLM)的发展，提示工程(Prompt Engineering)已成为有效使用这些模型的关键技能。不同的提示技术适用于不同的场景，本文将介绍七种主要的提示优化模式，并分析它们的适用场景和优缺点

2025-05-28 15:50:45 793

原创从零搭建 RAG 系统：原理与实践入门指南

在人工智能领域，大语言模型（LLM）展现出强大的自然语言处理能力，但它们往往依赖于预训练数据，在面对特定领域的新知识和实时信息时存在局限性。检索增强生成（Retrieval-Augmented Generation，RAG）系统的出现，为解决这一问题提供了有效途径。RAG 系统能够将外部知识库的检索与大语言模型的生成能力相结合，使模型在回答问题时既能利用预训练的通用知识，又能根据具体场景从外部数据中获取准确信息，显著提升回答的准确性和时效性。本文将详细介绍 RAG 系统的原理、架构，并通过实践步骤，帮助你从

2025-05-27 15:27:24 1141

原创 AI落地应用最新工具集｜附PDF文件下载

本手册突破传统工具罗列的局限，立足"场景-工具-价值"三维坐标，系统梳理文本生成、视觉创作、智能搜索等8大技术模块，覆盖从基层办公到战略决策的46个核心场景。通过构建"基础工具免费矩阵+行业解决方案+风险管控体系"的立体框架，既提供即插即用的单点突破利器，更着眼于企业智能化能力的系统搭建。在数字经济与实体经济深度融合的今天，这不仅是工具清单，更是企业重构竞争优势的转型指南，让AI真正成为触手可及的生产力杠杆。

2025-05-27 14:44:26 257

原创 2025人工智能行业人才供需趋势报告-猎聘（共59页 & 附下载）

《2025人工智能行业人才供需趋势报告》由同道猎聘集团发布，深入剖析了人工智能行业的发展现状、人才需求、供给情况以及未来趋势，为相关从业者、企业及求职者提供了极具价值的参考依据。

2025-05-26 14:45:05 326

原创 AI Agent 到底是什么？一文带你快速了解 AI Agent

自 ChatGPT 引爆生成式人工智能浪潮以来，大模型的能力边界不断被突破，从自然语言处理到多模态交互，从内容生成到代码自动化，AI 正在深度渗透企业运营的各个环节。当前主流的 AI 应用仍以“工具型 AI”为主，即通过人类的明确指令完成单一任务，行为更多体现在“响应能力”而非“自主性”。AI Agent 的出现，标志着生成式 AI 从静态工具迈向动态执行体的关键跃迁。作为具备感知、决策、规划、行动能力的智能体，AI Agent 不再仅仅“回答问题”，而是能够理解复杂目标、分解任务、调度工具并进行持续迭代优

2025-05-26 14:40:50 1239

空空如也

空空如也