- 博客(707)
- 收藏
- 关注

原创 DeepSeek 部署指南 (使用 vLLM 本地部署)
vLLM (https://github.com/vllm-project/vllm) 是一个快速且易于使用的库,用于进行大型语言模型的推理和部署。
2025-02-07 12:03:00
35883
5

原创 deepseek满血版本地最强部署教程!从此告别系统繁忙!
哈喽,大家好,要说当今社会什么东西最火那绝对是AI,在AI界最火的当属deepseek,然而所谓树大招风,由于它太优秀导致被各种攻击,所以就会导致使用是经常系统繁忙,实在影响使用心情,今天就教大家怎么在自己电脑本地部署DeepSeek R1 来解决这个问题。
2025-02-07 11:14:56
9643
1

原创 无需GPU!三步实现DeepSeek开源模型本地化部署。
deepseek和chatGpt最大的区别就在于,它是开源的模型,并且训练成本更低,这使得我们普通人也能够在自己的电脑部署大语言模型,训练自己的AI智能体。我们需要谨记的就是,AI是工具,是为了提高我们的效率,它能够给我们提供更精确,更具逻辑的回答,你再根据自身的需求进行修改和采用。最近Deepseek访问量剧增,导致App时常访问不了,但是不用担心,官方给我们提供了本地部署大模型的方案。
2025-02-05 11:06:52
22165

原创 DeepSeek全攻略:从零基础到精通的终极指南
Deep Seek是一款创新的智能搜索与分析平台,致力于通过先进的人工智能技术,帮助用户高效地从海量信息中提取关键信息。无论是数据挖掘、知识管理,还是市场分析,Deep Seek都能为您提供精准的搜索结果和深入的洞察力。今天,我们将带你深入了解这款工具,从入门到精通,掌握它的核心功能与使用技巧,开启高效智能工作的全新篇章。
2025-02-04 11:33:46
56545
原创 大模型入门必看!一口气上新 5 本!大模型重磅新作强势来袭!
大模型季度新书接踵而至,大模型领域的重磅好书即将登场!无论你是追求理论深度,还是渴望快速上手实战,这些即将上市的新书都会成为你大模型之路上的得力助手。准备好一探究竟了吗?
2025-05-17 11:30:00
337
原创 深入浅出AI Agent:原理、流程与实战代码解析
从ChatGPT的爆火到AutoGPT的崛起,AI Agent(智能体)技术正成为人工智能领域的新焦点。无论是个人效率助手、企业智能客服,还是复杂决策系统,AI Agent都展现出惊人的潜力
2025-05-17 08:15:00
516
原创 2024年企业AI大模型应用落地白皮书(免费下载)
在政策支持、技术变革以及企业数字化转型需求的驱动下,中国企业纷纷开始探索并实践AI对于业务的赋能,积极推进AI大模型的深度应用与落地,与此同时对大模型应用的精度、效果、开发和部署效率等都产生了更高的需求。本报告针对企业AI大模型落地需求与痛点、探索与成功路径、未来趋势与策略建议进行分析与洞察,旨在为企业应用端提供思路参考。
2025-05-16 10:57:48
747
原创 Open AI最新开源万字Agents搭建实践指南:从概念到实战
大语言模型处理复杂、多步骤任务的能力与日俱增。推理能力、多模态技术和工具使用方面的突破,催生了一种新型的由LLM驱动的系统——智能体。本指南旨在为致力于探索如何构建首个智能体的产品和工程团队提供参考。它提炼了众多客户部署实践中的宝贵见解,形成了一套实用且可操作的最佳实践。内容涵盖:
2025-05-16 10:55:53
768
原创 【科普】什么是大(语言)模型,大模型和小模型的区别是什么?
在人工智能飞速发展的当下,大语言模型成为行业焦点。它凭借强大能力革新着诸多领域,而小模型也在特定场景发挥作用。二者有何特性?又存在哪些差异?让我们一同深入探究。
2025-05-15 10:46:31
1003
原创 让 AI 看懂 PPT 图表!RAG 系统从 60 分到 95 分的进化历程,LlamaParse 与多模态实战深度解析
近期前线人员反馈,在使用问答系统处理PPT文件时回答效果不佳。经查发现,用户上传的PPT内容多为图文混排形式,包含大量图像和统计图表。用户提问主要聚焦于图表数据及其相互关系。我这里随意在网上找了一个PPT做尝试,这个PPT有一张图如下所示:
2025-05-15 10:39:47
818
原创 MCP 架构设计演进:从 Local MCP Server 到 Remote MCP Server 开源架构设计实现
Model Context Protocol(MCP)模型上下文协议(如下图所示)是 Anthropic 发布的一种标准化协议,使得 Agent 智能体应用可以更快捷地与下游异构的数据或者工具进行交互最近,两大关键事件标志着 MCP 已从事实标准迈向行业标准:一方面,OpenAI 正式宣布跟进 Anthropic 的 MCP 协议,另一方面,Anthropic 发布了新版本 MCP 协议,在 Remote MCP Server 的场景进行了显著改进。
2025-05-14 11:02:27
758
原创 7 款 AI 提示词 Prompt 生成器网站推荐,高手专用工具库!
随着AI技术浪潮席卷而来,不少创作者都会被功能强大的AI工具所吸引,进而主动探索学习与应用。熟练驾驭各类AI工具,的确能够为工作和创作注入全新活力,显著提升效率。然而,对于零基础的AI新手而言,撰写提示词往往是一大难关。即便反复调试,也难以达到网络达人那般出色的创作水准。事实上,掌握优质提示词的撰写技巧,正是缩小与高手差距的关键所在。值得一提的是,提示词的创作也可以借助AI完成,毕竟AI对自身运作逻辑有着天然的理解优势。接下来,为大家精心推荐7款实用的AI提示词生成工具,助力各位开启AI创作的全新旅
2025-05-14 10:50:51
1349
原创 MCP是什么,一篇搞懂MCP爆火的其中奥秘!
Model Context Protocol (MCP) 是一个社区共建的开放协议,由 Anthropic 在 2024 年 11 月推出,旨在使 AI 模型,尤其是大型语言模型(LLMs),能够更容易地与外部数据(如文件、数据库或 API)连接。它就像一个通用插头,可以让 AI“与”不同的系统交流,而不需要为每个系统进行定制设置。
2025-05-13 10:44:52
969
原创 如果你正在研究RAG,那么这 10 个开源框架绝对不容错过!
检索增强生成(RAG) 如今已发展为一种极具效力的技术,能够显著增强大型语言模型的能力。RAG 框架有效融合了检索系统的优势以及生成模型的能力,促使其生成的响应具备更高的准确性,与上下文的关联性更强,并且能够实现实时更新。随着市场对于复杂 AI 解决方案的需求日益增长,在 GitHub 平台上出现了大量开源的 RAG 框架,每一个框架都具备独特的功能与优势。
2025-05-13 10:39:21
832
原创 【最强知识库】Qwen3大模型永久白嫖!手把手教你搭建本地知识库,打造你的专属最强大脑!
今天就来给大家介绍一个Cherry studio中非常实用的功能,那就是本地知识库的构建。
2025-05-12 11:09:39
816
原创 通俗易懂解析 GenAI 核心概念 —— 涵盖 RAG、函数调用、MCP 直至 AI 智能体
随着大语言模型的快速发展,它在知识时效性、生成准确性以及与外部系统交互等方面的局限性日益突出。为解决这些问题,检索增强生成(RAG)、函数调用(Function Calling)、模型上下文协议(MCP)以及 AI 智能体(AI Agent)等一系列技术纷纷出现,旨在提升模型的“知识新鲜度”和“操作执行能力”。最近,CloudCanal 上线了 RagApi 功能,同时采用了 MCP 协议。本文将着重阐述 RAG、Function Calling、MCP、AI Agent 等关键概念,并详细介绍
2025-05-12 11:02:13
1228
原创 当心!你的AI可能正在被“黑化“:【一文读懂】AI提示词(Prompt)攻击
随着大型语言模型LLMs的广泛应用,其安全性问题也逐渐凸显。Prompt攻击是一种新型攻击手段,通过精心设计的操纵输入提示词突破模型的安全限制,使其生成不符合预期甚至有害的输出的攻击行为。其本质是利用模型对自然语言输入的敏感性,绕过系统的安全审查或功能限制,从而实现信息泄露、内容篡改甚至系统越权等操作。
2025-05-10 11:20:18
859
原创 一文带你了解8 种 LLM 推理部署方案【建议收藏】
本文是对一些主要的机器学习模型部署和推理服务的概述和关键特性总结。这里是一些需要考虑的关键点:Triton Inference Server - 一个强大的平台,用于在生产环境中部署和扩展机器学习模型。设置 Triton Inference Server 可能是一个复杂的过程。文本生成推理 - 需要原生支持 HuggingFace,且不打算为核心模型使用多个适配器。vLLM - 需要最大速度来批量传递提示。DeepSpeed-MII - 有使用 DeepSpeed 库的经验,希望继续使用它来部署大型语言模型
2025-05-10 11:12:52
959
原创 2025大模型面试全攻略:从基础到进阶,一文掌握
随着大模型应用场景的不断拓展,从智能聊天机器人到智能医疗诊断,从智能写作辅助到智能图像生成,其影响力无处不在,与之相应的,对大模型专业人才的需求也呈现出爆发式增长。如果你也渴望投身于这个充满机遇与挑战的领域,那么,一场精心准备的大模型面试便是你开启梦想之门的钥匙。
2025-05-09 11:29:27
793
原创 2025“人工智能+”行业发展蓝皮书解读(137页附下载)
这份报告是《2025“人工智能+”行业发展蓝皮书》,由上海交通大学行业研究院发布。报告全面梳理了人工智能(AI)技术的发展现状、趋势、应用场景以及相关政策和伦理问题,旨在为政府、企业和研究机构提供决策参考。以下是对这份报告的核心内容解读:
2025-05-09 11:22:11
766
原创 Coze vs Dify vs n8n 一文读懂三大热门工具的核心差异(技术贴,小白勿看)
在当下数字化转型的浪潮中,Coze、Dify 和 n8n 作为自动化领域备受瞩目的工具,各自凭借独特的优势在不同场景中发挥着关键作用。对于技术人员而言,深入了解它们的核心差异,有助于在项目开发、流程优化等工作中做出精准的选择。本文将从技术架构、功能特性、应用场景、开发门槛等多个维度,对这三大热门工具进行全面剖析。在深入对比之前,我们先快速了解一下这三位“选手”:Coze 由字节跳动 推出,是新一代一站式 AI Bot 开发平台,面向广大非技术用户,主打零代码或低代码开发体验。在 Coze 平台上,用户无需编
2025-05-08 10:45:48
733
原创 一文讲清:大模型七大工具&框架,看这篇就够了!
LangChain 是一个用于构建基于大型语言模型(LLM)应用程序的开源框架,旨在帮助开发者将语言模型与其他数据源、工具和计算资源结合,创建更复杂且实用的应用。通过 LangChain,开发者可以快速构建从简单问答到复杂企业级应用的 LLM 驱动系统,充分发挥语言模型的潜力。LangChain 的核心目标是解决语言模型在实际应用中的局限性,例如:静态性: 传统 LLM 缺乏动态更新知识的能力孤立性: 模型难以直接访问外部数据或工具(如数据库、API)上下文缺失: 无法长期保存对话历史或用户状态。
2025-05-08 10:31:26
1014
原创 大模型入门超全指南来了!一文看懂大模型:从原理到应用
大模型就像一把威力巨大的双刃剑,既能为我们的生活和工作带来诸多便利,创造无限可能,也伴随着一些不容忽视的问题。随着技术的不断进步,相信未来我们能开发出更聪明、更安全、更环保的 AI。如果你对大模型感兴趣,不妨从学习设计优质的 Prompt 开始,亲自体验和这个超级大脑 “对话” 的奇妙乐趣!
2025-05-07 10:43:01
974
原创 大模型方向有哪些具体岗位?一文带你了解!
如今大模型技术越来越火,很多人都想进入这个领域找份好工作。但大模型方向的岗位五花八门,不少人都看得一头雾水。别担心!今天就用大白话,带你认识大模型方向的具体岗位,看看哪个适合你!
2025-05-07 10:21:28
899
原创 2025程序员转行做大模型职业发展前景好吗?可以选择哪些岗位,如何选择?
2025 年,随着 DeepSeek 的诞生和大模型技术进步,AI 行业变得火热。这给很多程序员带来了转行的好机会。
2025-05-06 10:50:10
846
原创 大模型入门指南 - Training:小白也能看懂的“模型训练”全解析
Training(模型训练)本质是AI世界的‘科学烹饪实验’——以数据为食材原料,用超参数作配方比例,借验证集做品控质检,将‘玄学炼丹’的试错过程,淬炼成‘可复现的精密工程’。今天用最通俗的话,带你拆解模型训练(Training)全过程。模型训练(Model Training)是机器学习过程中的核心步骤,它涉及使用训练数据来调整模型的参数,以便模型能够准确地预测或决策。这个过程可以被看作是模型学习如何从输入数据中提取模式和特征,并将其应用于新数据的过程:模型的课本+练习题,用于学习。
2025-05-06 10:43:35
805
原创 0基础也能听懂:从预训练到SFT,对话模型技术栈深度拆解!
怎么样,看完这一路拆解,是不是觉得对话模型也没那么高深莫测了?从预训练到SFT,我们把一堆乱码变成会聊天的AI的过程掰开了揉碎了讲清楚。即便你是零基础,现在也能拍胸脯说自己懂了点门道。
2025-05-05 11:53:12
684
原创 小白学大模型:从零实现 LLM语言模型
在当今人工智能领域,大型语言模型(LLM)的开发已经成为一个热门话题。这些模型通过学习大量的文本数据,能够生成自然语言文本,完成各种复杂的任务,如写作、翻译、问答等。本文将为你提供一个简单直接的方法,从下载数据到生成文本,带你一步步构建大院模型。在开始训练语言模型之前,你需要对面向对象编程(OOP)、神经网络(NN)和 PyTorch 有基本的了解。训练语言模型需要强大的计算资源,尤其是 GPU。不同的 GPU 在内存容量和计算能力上有所不同,适合不同规模的模型训练。
2025-05-05 11:26:11
1364
原创 初级 RAG vs高级 RAG,到底有什么区别?
如今,LLM 的内容生成能力早已改变了世界。这些模型在创造新内容和给出智能回复这类任务上表现出色,推动了生成式 AI 领域的发展。不过,虽然模型被喂了大量的数据进行训练,但受限于难以获取实时最新的信息,LLM 无可避免地会给出过时的答案或错误的信息,即所谓的信息幻觉。为了解决这些问题,检索增强生成(RAG)的动态框架出现了。它结合了传统大模型的优势和检索系统,扩展了这些模型的用例。RAG 简单来说是一种旨在提升 LLMs 性能的策略性增强技术。
2025-05-04 10:00:00
1005
原创 清华大学大模型报告下载:3大技术挑战破解方案曝光(附完整PPT)
清华大学:关于人工智能大模型的几点思考PPT》是清华大学推出的AI大模型指南,主讲人是郑纬民。这篇干货直接给AI行业泼了盆冷水——现在大厂们卷大模型快把显卡烧冒烟了,但真正的技术暗战全在看不见的底层系统里。这份文档最颠覆认知的是——AI竞赛早就不是拼算法创意的阶段了,真正的战场在文件系统、编译器这些基础软件。就像智能手机大战,最后赢家不是摄像头像素最高的,而是能把触控屏响应做到毫秒级的。
2025-05-04 09:00:00
696
原创 复旦大学LLM全栈指南:预训练到应用全流程解析(附合集课件下载)
正文介绍(文末有免费下载方式)复旦大学这两本大模型“红宝书”的迭代史,堪称一部中国AI学术圈应对技术革命的“进化论”样本。从第一版到第二版的蜕变,不仅折射出大模型技术的狂飙突进,更暗藏着一线研究者对行业生态的深刻洞察。第一版:大模型时代的“开荒指南”2023年9月面世的首版,像极了一场及时雨。当全球开发者还在ChatGPT的震撼中晕头转向时,张奇团队用297页构建起完整的技术图谱。书中“预训练-微调-强化学习”的三段式框架,恰如庖丁解牛般拆解了神秘的黑箱模型。特别是在DeepSpeed分布式训练案例中,作
2025-05-03 10:15:00
1176
原创 深度介绍:AI产品经理入门Agent必读!
人类在复杂的模式识别任务中表现卓越,但通常需要借助工具(如书籍、搜索引擎或计算器)来补充先验知识以得出结论。同理,生成式AI模型可通过训练使用工具获取实时信息或建议的实际动作。模型可利用数据库检索工具获取客户购买历史以生成个性化购物推荐基于用户查询,模型可通过API调用发送邮件或完成金融交易外部工具集访问权限自主规划与执行任务的推理能力这种结合推理逻辑与外部信息访问的系统,即构成智能体(Agent])。
2025-05-03 07:00:00
996
原创 机器人+人工智能如何重塑工业?信通院88个案例揭示汽车电子金属三大行业转型(免费领报告)
是中国信通院推出的AI大模型报告。这篇报告勾勒出"AI+机器人"撬动工业革命的清晰图景,读完后最直观的感受是:苏州正悄然成为这场革命的"风暴眼"。作为长三角制造业重镇,这里不仅坐拥拓斯达、钧舵等本土机器人新贵,更吸引了特斯拉、优必选等巨头布局,形成从核心部件到整机应用的完整生态链。这种产业集群效应,恰似当年硅谷之于互联网革命。技术演进路径中,“具身智能"的突破最令人兴奋。
2025-05-02 12:30:00
790
原创 万字长文!从AI Agent到Agent工作流,一文详细了解代理工作流(Agentic Workflows)
AI 代理是一种结合了大型语言模型(LLMs)的推理与决策能力,以及现实世界交互工具的系统,使其能够在有限的人类干预下完成复杂任务。代理被赋予特定的角色,并拥有不同程度的自主性来实现最终目标。它们还具备记忆能力,能够从过去的经验中学习,并随着时间的推移提升性能。为了更好地理解AI代理在代理工作流中的作用,需要先了解它们的核心组成部分。在一般情况下,工作流(Workflow)指的是一系列相互关联的步骤,旨在完成特定任务或目标。最简单的工作流是确定性的(Deterministic)
2025-05-02 07:15:00
829
原创 LLM常见面试问题- SFT篇
这个说法不一,所以要根据自己场景选用不同的方法,如果资源充足的话,建议SFT和PEFT都尝试一下,选用效果最用的方式,如果资源不足,建议选PEFT。从理论分析上来看,SFT会修改大模型全量参数,可以在数据量充足的情况下学习更多的内容,效果上限应该更高,但也存在灾难性遗忘等不稳定情况。
2025-05-01 11:15:00
922
原创 Qwen2-VL多模态大模型微调实战(完整代码)
Qwen2-VL是阿里通义实验室最新推出的多模态大模型。本文我们将简要介绍基于 transformers、peft 等框架,使用 Qwen2-VL-2B-Instruct 模型在上进行Lora微调训练,同时使用 SwanLab 监控训练过程与评估模型效果。
2025-05-01 09:00:00
1000
原创 145页|2025工业大模型白皮书(附PDF下载)
工业大模型作为新一代人工智能技术与工业场景深度融合的结晶,正以前所未有的速度重构制造业的智能化体系。随着第四次工业革命的推进,工业大模型凭借其卓越的数据处理能力、出众的跨模态融合特性以及高效的智能决策效能,日益成为推动工业智改数转的核心驱动力。然而,尚处于初级发展阶段的工业大模型,仍面临工业数据多模态复杂性、模型可解释性不足以及应用成本较高等挑战。为此,行业迫切需要系统性的解决方案,以促进工业大模型技术的有效落地与广泛应用。
2025-04-30 10:33:52
686
原创 新手小白也能学会的Dify本地部署教程(超详细)
首先打开Docker官网,点击按钮,选择Windows版本的Docker安装包,点击下载。下载完成后,打开安装包,一路点击下一步即可,该过程中Docker会自动拉取所需的内容。完成后打开cmd(cmd打开方法请看图),输入docker,如果下方出现Docker的命令提示就代表安装成功了。安装完Docker后可能会出现打开报错的情况,报错主要是提示WSL版本过低、WSL更新失败或者没有WSL,此时需根据提示针对性解决。如果提示WSL版本过低或者更新失败,则打开cmd,输入wsl --update。
2025-04-30 10:29:40
2514
原创 全网最全3W字综述,大模型核心技术:微调、推理与优化指南!
大语言模型(LLM)是非常庞大的深度学习模型,它们在大量数据上进行预训练。其底层的Transformer是一组神经网络,由具有自注意力能力的编码器和解码器组成。编码器和解码器从文本序列中提取含义,并理解其中单词和短语之间的关系。Transformer神经网络架构允许使用非常大的模型,这些模型通常包含数千亿个参数。如此大规模的模型可以摄取大量数据,这些数据通常来自互联网,也可以来自如包含超过500亿个网页的Common Crawl,以及约有5700万页面的维基百科等来源。
2025-04-29 11:00:06
1016
原创 2025央国企必看!5大转型痛点+AI应用指南(免费下载)
聚焦于央国企在人工智能与数智化转型方面的现状、挑战与未来趋势。报告深入探讨了央国企数智化转型的驱动因素、发展现状、核心挑战,并提供了具有前瞻性的未来展望与对策建议,为央国企加速数智化转型提供了有力支持。
2025-04-29 10:54:22
579
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人