大模型大模型-CSDN博客

原创 DeepSeek 入门到精通！（清华大学版）

今天给大家推荐一份清华 DeepSeek 使用手册，真的好好用~~清华大学团队出品的 DeepSeek 学习手册，深入解析国产开源 AI DeepSeek 的强大功能，让你从入门到精通，轻松掌握 AI 高效玩法！真的太强了！完整报告104页，文章长度有限无法完整展示，完整资料已经打包放到了网盘，需要的同学自取我的DeepSeek部署资料已打包好（自取↓）但如果你想知道这个工具为什么能“听懂人话”、写出代码甚至预测市场趋势——答案就藏在大模型技术里！❗️为什么你必须了解大模型？

2025-02-10 16:27:46 3237

原创保姆级实战教程：安装部署私有化大模型，并投喂数据

想要部署属于自己的大模型，会不会很困难？其实不是的，现在是越来越简单。潘哥今天就做一个简单的示范，让大家都能轻松搞定在自己的电脑哦上，本地化部署并运行私有化大模型，并且为我们自己的大模型投喂数据。这样，就可以建立自己的数据仓库，没错，就可以定制垂直行业或细分领域的私有化大模型了。酷~~~首先，我们会用到Ollama，功能是运行大模型。Ollama是一款LLM也就是大型语言模型服务工具，可以极大简化在本地运行大语言模型，极大降低了使用大语言模型的门槛，而且是开源的哦。

2025-01-28 07:00:00 6493

原创国产AI大模型「医疗十大应用场景」案例盘点，推动医疗健康领域智能升级

人工智能技术的浪潮正席卷全球，AI大模型以其卓越的数据处理能力和深度学习能力，正在成为医疗健康领域变革的关键力量。本文将深入探讨AI大模型在医疗十大场景中的创新实践，展示其提升医疗服务效率、赋能临床决策、推动行业智能化转型的广阔前景。基于海量医疗数据，辅助临床诊断决策AI大模型通过分析海量医疗数据，能够辅助医生进行更准确的诊断。例如，百度灵医大模型利用其强大的数据处理能力，通过API或插件嵌入的方式，在200多家医疗机构中展开应用，显著提升了诊断的准确性和效率。

2024-12-27 11:24:15 6491

原创七款国产AI大模型：Kimi，智谱清言，通义千问，文心一言，豆包，天工AI，讯飞，各自的优缺点是什么？

优点：Kimi这货，免费还能多平台支持，不光能实时联网，处理长文本也不带喘的，简直就是程序员的贴心小棉袄啊。缺点：不过呢，这家伙在特定领域翻译上就有点儿不太行，有时候还会抽风宕机，咱也不知道它为啥这么脆弱。优点：智谱清言是清华系的，不光会码代码，还能画图表，简直就是学霸中的学霸。尤其是它的多模态处理和图片理解能力，真心厉害。缺点：不过，别太指望它啥都懂，遇到特别复杂或者前沿的东西，它有时候也会掉链子。优点：阿里云的招牌产品，超大规模，能聊会说，还能处理多语言，厉害得不得了。

2024-12-12 16:24:48 6390

原创什么是算法工程师？算法工程师有前景吗？

什么是算法工程师？算法工程师说目前最炙手可热的岗位。虽然算法工程师一直被频频提及，但是许多人对这个岗位的了解还知之甚少。那么算法工程师究竟是做什么的？前景怎么样呢？下面我们来一起解开这个高薪技术岗位的神秘面纱!

2023-10-02 08:15:00 3040

原创报告推荐｜2024智算与大模型人才白皮书（附88页PDF文件下载）

近两年，以生成式AI大模型为代表的人工智能技术发展速度令人震惊，其快速应用也嫌弃了人工智能崛起热潮，成为数字化转型背景下又一项颠覆性的技术革新。人工智能的火热为各行业带来了发展机遇的同时，也让整个社会面临着挑战。比如对数据的处理使用、算力和算法等都提出了高要求。

2025-06-11 15:47:43 136

原创不懂RAG？看这一篇万字长文就够了，中科院出品

传统的语言模型，比如 GPT-3，虽然在生成文本方面表现出色，但它们有一个显著的局限性：它们依赖于预训练的参数，无法动态访问外部知识。这意味着这些模型在处理实时信息、领域特定知识或罕见实体时表现不佳。举个例子，在问答任务中，模型可能会生成不准确或过时的答案，因为它无法访问最新的数据。就像你问一个朋友“今天天气怎么样？”，但他只能告诉你去年的天气情况，显然这样的信息对你来说毫无用处。

2025-06-11 15:43:03 217

原创北京大学｜第十一弹来了！221页《AI Agent与Agentic AI原理与应用》，最全、最新，堪称无敌！

《DeepSeek内部研讨：AI Agent与Agentic AI原理与应用》是由北京大学DeepSeek团队联合北大青鸟人工智能研究院、计算机学院、教育学院共同撰写，系统剖析AI Agent技术内核与实践路径。这份221页的前沿报告，从底层架构到行业应用，为开发者、工程师及技术决策者提供硬核洞察与落地指南。

2025-06-10 15:13:03 249

原创 RAG系列：万字详述RAG的5步流程和12个优化策略,看这一篇就够了！

ChatGPT、GLM等生成式人工智能在文本生成、文本到图像生成等任务中表现出令人印象深刻的性能。但它们也存在固有局限性，包括产生幻觉、缺乏对生成文本的可解释性、专业领域知识理解差，以及对最新知识的了解有限。为了克服这些限制，提高模型的能力，有两种主要途径：一种是微调（Fine Tune）来更新模型，另一种是让他们能够与外部世界互动，以不同的形式和方式获取知识。

2025-06-10 15:06:40 557

原创哈尔滨工业大学：大模型原理、技术与应用——从GPT到DeepSeek（免费下载）

哈工大赛尔实验室发布的《大模型原理、技术与应用》报告，详细阐述了自然语言处理技术从浅层机器学习到大模型的演变历程。报告指出，GPT-3凭借1750亿参数引领行业，但其在常识推理和可解释性上存在明显短板。DeepSeek-R1模型以开源、高性价比的姿态入局，通过强化学习（RL）自主习得推理能力，在AIME2024测试中pass@1分数从39.2%飙升至71.0%，逼近OpenAI-01水平。此外，报告还揭示了大模型在医疗、教育、金融等领域的应用潜力，以及未来向AGI迈进的技术路线图。

2025-06-09 15:53:20 460

原创基于图的 RAG 方法总结（GraphRAG、 GraphReader、LightRAG、HippoRAG和KAG）

在自然语言处理领域，检索增强生成（RAG）技术通过结合外部知识库与语言模型，显著提升了模型在知识密集型任务中的表现。近年来，基于图结构的 RAG 方法成为研究热点，通过引入知识图谱的实体关系建模能力，有效解决了传统 RAG 在多跳推理、长文本理解和全局语义捕捉中的局限性。本文详细分析五种代表性方法：GraphRAG、GraphReader、LightRAG、HippoRAG和KAG ，从实现细节、优缺点及适用场景展开对比。

2025-06-09 15:38:59 956

原创 25 年大模型面试必问【大模型面试题总结篇】背完通过率 98%！一定要用起来！

大模型面试必看

2025-06-07 15:43:53 573

原创 25个AI Agent真实案例，看懂Agentic AI如何助力企业业绩倍增

在Anthropic发布了最新的Claude 4系列模型后，整个行业又躁动了。特别是Claude 4 Opus模型，凭借其在复杂任务处理、持续专注力以及编码与推理能力上的显著跃升，直指企业级复杂应用场景。不仅是模型能力的迭代，更是Anthropic在AI Agent商业化落地与安全可控方面决心的体现。

2025-06-07 15:35:27 828

原创 Response指南：为什么90%的多模态RAG，一做就会，一用就废？

近年来，GPT-4V、Gemini Pro Vision 等多模态大模型快速兴起，将图像、文本、音频等多种数据类型统一理解的能力，拓展到了搜索问答、辅助诊疗、法律检索等更复杂的任务场景中。相比传统大语言模型（LLMs），多模态大模型具备更强的上下文理解能力，适配更丰富的输入方式，具备更广泛的落地潜力。

2025-06-06 15:11:16 564

原创【报告分享】AI产业全景洞察报告2025（附下载）

《AI产业全景洞察报告2025》由MoonFox与AI与管理创新研究中心联合发布，从发展现状、全景研究、企业出海等方面对AI 产业进行了全面剖析。

2025-06-06 15:08:59 813

原创 2025年大模型平台落地实践研究报告｜附75页PDF文件下载

本报告旨在为各行业企业在建设落地大模型平台的过程中，提供有效的参考和指引，助力大模型更高效更有价值地规模化落地。本报告系统性梳理了大模型平台的发展背景、历程和现状，结合大模型平台的特点提出了具体的落地策略与路径，同时详细分析了大模型平台的关键能力及其建设要点，并对多个行业的落地案例进行了深入剖析，最后对大模型平台的发展趋势进行展望。

2025-06-05 15:43:29 231

原创 AI产品风向标：从「工具属性」到「认知引擎」的架构跃迁

近年来，人工智能正在改变法律行业的游戏规则。从最初的“工具属性”——帮律师干些重复的杂活儿，到如今逐渐变身为“认知引擎”——能够理解法律逻辑、分析案例，法律AI产品正在迎来一场华丽的转身。这篇文章将带你一探究竟，看看这场技术跃迁如何让律师的工作更高效，也让我们普通人离“公平正义”更近一步。不管你是法律小白还是科技迷，相信你都会在这里找到一丝好奇和共鸣。

2025-06-05 15:38:32 578

原创 AI大模型·白皮书 | 2025大模型翻译技术及产业应用蓝皮书

主要探讨了大模型翻译技术的发展及其在科研、企业全球化、国际传播和专业翻译等领域的应用。文章指出，大模型翻译技术通过深度语义理解、交互式翻译和外部知识增强等能力，显著提升了翻译的准确性和流畅度。文中引用了多项调研数据，如86.67%的受访者认可“大模型+译后编辑”将成为未来主要翻译工作模式，以及63.46%的受访者表示其所在单位计划或已经应用大模型。文章还提到，新一代智能翻译平台具备多模型协同、知识增强体系和场景化解决方案等核心特征，能够提供更精准、高效的翻译服务。此外，大模型翻译技术在科研创新、企业全球化

2025-06-04 15:43:04 850

原创【万字长文，建议收藏】AI Agent企业应用场景全解：30个智能体落地案例剖析

在数字化转型进程中，企业需要能够随业务发展灵活调整的智能化资源。AI Agent恰好能够满足当前和未来业务的多样化需求。借助AI Agent，企业可以摆脱重复性任务执行、人为错误、流程瓶颈和人员超负荷等诸多困扰。在生成式AI和机器学习算法的支持下，AI Agent能够模拟人类智能，高精度、高准确度地执行复杂任务。其适应业务需求并为客户提供个性化体验的能力，正推动各行业加速采用这一技术。2023年AI Agent市场规模达到48亿美元，并预计以43%的年复合增长率发展，到2028年底将达到285亿美元。

2025-06-04 15:37:24 745

原创【大模型开发Token指南】一次Token是一次调用？不要误解大模型的“计费单位”

在第一次使用 ChatGPT 或调用大模型 API 的时候，是不是被这个提示吓过：

2025-06-03 17:20:02 1085

原创 2025年AI智能体平台大爆发，哪家最值得选

国内AI智能体（Agent）生态爆发式增长，从商业巨头到开源社区，各类产品正重塑工作与生活。智能体平台有哪些？AI智能体平台哪个更好？本文带你梳理主流智能体商业产品、5大智能体开发框架，助你找到最适合的智能体解决方案。

2025-06-03 17:16:56 1434

原创 2025中国人工智能行业大模型应用实践与展望报告（附PDF下载）

这份报告专注于中国人工智能行业大模型的应用实践与未来展望。大模型在人工智能领域的影响力日益增强，报告详细介绍了大模型在中国各行业的应用情况，如自然语言处理、计算机视觉等领域的实践案例。分析了大模型应用面临的挑战，包括模型训练成本高、数据质量参差不齐等问题。同时，对大模型的未来发展进行了展望，预测了技术发展方向和应用场景拓展趋势。对于中国人工智能企业来说，有助于其借鉴应用经验，优化大模型应用策略；对于行业发展而言，为推动大模型技术的创新和应用普及提供了参考，促进中国人工智能行业在大模型领域的持续发展。

2025-06-02 10:45:00 1349

原创企业级RAG知识库构建：从痛点到解决之道

在企业数字化转型的浪潮中，RAG（检索增强生成）技术以其连接海量知识与大模型的能力，成为知识管理领域的焦点。然而，当这一技术蓝图遭遇企业实际场景——海量文档、结构复杂的表格与严苛的业务指标时，往往呈现出理想与现实的巨大落差。

2025-06-02 09:15:00 823

原创人工智能行业2025年一季度投融市场报告（附22页PDF文件下载)

2025 年一季度中国人工智能行业投融资市场呈现 “量增价减” 特征，融资案例数达 241 起（环比 + 10.6%、同比 + 21.7%），但金额降至 181.4 亿元（环比 - 20.4%、同比 - 19.3%），早期项目占比提升，资本更倾向小规模高潜力企业。机器人、AI 软件平台及 AI 玩具成热门领域，其中 AI 玩具市场预计 2023-2033 年复合增长率达 15.7%。地域上，北京、广东、上海等省市融资集中，深圳等地政策（如 2026 年 AI 企业超 3000 家的目标）进一步激活区域活力

2025-05-31 11:45:00 728

原创 Ollama vs vLLM 私有化部署终极对比：选型、实战与避坑指南

在大语言模型技术快速迭代的浪潮中，数据安全与定制化需求推动着私有化部署成为企业和开发者的重要选择。Ollama 和 vLLM 作为两款备受关注的大语言模型部署和推理开源框架，各有千秋。接下来，我们将从多个关键维度对二者进行深度剖析，为你的私有化部署选型提供全面参考，并分享实用的实战经验与避坑技巧。

2025-05-31 10:15:00 832

原创一文详解分布式Agent系统架构，及全新AutoGen框架下的分布式Agent Demo体验

AI Agent（智能体）系统发展迅猛，且关注点已经不再局限在Agent的规划推理等基本能力，智能体系统在扩展性、互操作、安全性等工程化方面的挑战也越来越引起重视，比如最近的MCP和A2A。上一篇我们介绍了A2A，今天接着再聊聊分布式Agent系统的话题。

2025-05-30 15:13:59 792

原创【科普】Transformer中的编码器和解码器有什么区别？

2017 年发表的著名论文《Attention is All You Need》首次揭示了注意力机制的强大作用，这也是大型语言模型能展现出惊人能力的核心所在。论文作者提出了一种名为 Transformer 的网络架构（和 “变形金刚” 是同一个英文单词），它完全基于注意力机制，摒弃了此前提到的RNN。与RNN相比，Transformer支持并行训练，这大大加快了训练速度。

2025-05-30 15:05:29 887

原创 AI能力图谱全解：AI产品经理构建智能产品的核心认知框架

在AI驱动的时代，产品经理如何不再只是“对接需求的人”，而是成为连接技术与业务的桥梁，设计真正有“智能”的产品？答案就是：掌握一张全面、系统的AI能力图谱。它不仅是一张技术地图，更是一份通向AI产品成功落地的思维工具箱。本文将逐层深入，从产品落地的视角彻底解读这张图谱，帮助你理解它为何是AI产品经理的核心能力之一。

2025-05-29 16:48:46 770

原创【AI Agent深度研究报告】2025年，AI Agent应用全面爆发：它到底能干掉多少岗位？

五年前，你或许还在对 Siri 说“今天天气怎样”；两年前，你开始用 ChatGPT 辅助写作。而今天，AI智能体（Agent）正横空出世，宛如一个具备“数字大脑”的全能秘书，悄然改变我们的工作模式与生活方式。

2025-05-29 16:47:18 706

原创实战指南：从零构建 MCP 架构下的 Agentic RAG 系统，无第三方MCP Server

RAG是一种借助外部知识来给LLM提供上下文的AI应用范式。从这个角度来说，RAG与MCP有着相似的意义：给大模型补充上下文，以增强其能力。只是MCP以提供外部工具为主，而RAG则是以注入参考知识为主。这就像一个考试的学生，MCP给你提供计算器，而RAG则是给你一本书。当然，两者的重点并不一样，

2025-05-28 16:56:39 925

原创一文了解：AI大模型的10大核心能力和10大应用领域

从2023年初ChatGPT重磅亮相开始，大模型技术的发展成为了AI领域的焦点，驱动了AI应用的升级和创新。在ToB业务领域，AI大模型技术也在逐步改变企业的业务开展、产品服务、运营管理的传统模式，企业端对大模型的应用也已从初步的技术探索与创新尝试，逐渐步入以实现商业价值为核心的新时代，其中构建商业闭环、验证价值的应用场景是关键，作为相关领域从业者，也要了解AI大模型的核心能力和典型应用领域。结合IDC 2024研究报告的内容和大家简单聊聊！

2025-05-28 16:52:35 692

原创新手必收！LoRA入门指南，教你低成本微调大模型超实用方法！

还在为“全量微调大模型”望而却步？显存不够、算力太贵、调不动7B模型……这些痛点，被一个技术方案悄悄解决了——它叫 LoRA（Low-Rank Adaptation）。

2025-05-27 15:12:36 986

原创中国信通院《算力电力协同发展研究报告(2025年)》（附下载）

2025年5月8日，中国信息通信研究院（简称“中国信通院”）云计算与大数据研究所在算力电力协同专题研讨会上发布《算力电力协同发展研究报告（2025年）》，中国信通院云计算与大数据研究所副所长李洁对报告进行了深入解读。报告深入剖析了算力电力协同发展的背景与需求，对未来算力用能的发展趋势和特征进行预测，系统阐述算力电力协同的内涵、要素与发展阶段，探讨算电协同发展所面临的挑战，针对性提出算电协同发展的六大关键举措，最后从政策支持、标准制定、产业协同、市场机制等维度，提出推动我国算力电力协同高质量发展的策略建议

2025-05-27 14:50:41 542

原创 2025普通人想转AI大模型应用开发，方法很重要‼️

AI对各行各业的渗透已经无需多说，无疑是2025年的热门关键字，很多公司都在转型做AI相关的产品，或者高薪挖相关的技术人才。

2025-05-26 15:22:01 1275

原创大模型（Qwen3）训练实战：从零开始玩转LLaMA-Factory

在人工智能技术日新月异的今天，大型语言模型（LLM）已成为科技领域的热门话题。但对于大多数开发者和企业来说，如何高效、低成本地微调这些"庞然大物"仍是一个难题。今天，我将为大家详细介绍如何使用LLaMA-Factory这一开源框架，从环境搭建到模型训练，再到实际应用，手把手教你打造属于自己的AI助手！

2025-05-26 15:16:24 893

原创清华大学-关于人工智能大模型的几点思考2025（附PDF下载）

人工智能进入大模型时代，大模型从单模态向多模态发展，在文本交互、图像创作、视频生成等方面成果显著，并加速行业智能化升级。但大模型发展面临数据存储、算力、数据预处理等挑战，如海量小文件存储的元数据管理难、训练需海量算力、数据预处理开销大等。为此提出多种解决方案，包括设计新的文件系统、以数据为中心的计算模式、分布式检查点策略等。同时，中国 AI 内循环加速，国产算力快速发展，相关基础软件层不断完善，在大模型训练和推理方面取得性能提升。

2025-05-24 16:18:07 317

原创一文带你选对效率翻倍Agent工具：AI智能体平台怎么选？

今天来聊聊那些主流的 AI智能体平台，现在 AI 智能体技术发展得那叫一个快，各种平台如雨后春笋般冒出来。这些平台各有各的绝活，能帮咱们轻松打造出厉害的智能体。今天，就挑三个最主流的平台——Dify、Coze 和 FastGPT，来好好比比它们到底谁更胜一筹。

2025-05-24 16:09:39 811

原创 2025 程序员转型大模型应用开发全攻略：从入门到实战的系统指南（附完整学习路线图 + 开发资源包）

在人工智能浪潮席卷全球的 2025 年，大模型应用开发无疑是科技领域最炙手可热的赛道。无论是智能客服、智能写作，还是个性化推荐系统，大模型都在发挥着越来越重要的作用。许多传统程序员也敏锐地察觉到了这一趋势，渴望转行投入大模型应用开发的怀抱。别担心，这篇文章将为你提供一份从零到精通的实战指南，还附上超实用的学习路线和资源包，助你顺利转型！

2025-05-23 14:50:46 862

原创资料分享丨2025年智能分析Agent白皮书（附58页文件下载）

报告指出，在全球数据量激增的背景下，传统决策方式效率低下，难以捕捉关键信息。大模型技术的发展，尤其是DeepSeek等低成本高性能智能体系的出现，为“普惠化智能应用”提供了技术实现路径。企业端聚焦于结构化数据的智能分析与非结构化数据的知识问答两大关键领域。报告提出了MAGIC框架，涵盖AI Agent的五大关键能力：多模态环境感知、动态复杂推理、面向目标的行动规划、智能工具编排API和持续学习与迭代。通过这些能力，智能分析Agent能够实现从感知到执行再到进化的完整闭环，极大地拓展数据分析的深度与广

2025-05-23 14:46:44 590

原创程序员转行AI大模型教程（非常详细），大模型入门到精通，收藏这一篇就够了！

在人工智能（AI）迅速发展的背景下，从传统的编程领域如Java程序员转向大模型开发是一个既充满挑战也充满机遇的过程。对于 Java 程序员来说，这也是一个实现职业转型、提升薪资待遇的绝佳机遇。一、明确大模型概念

2025-05-22 16:32:17 846

空空如也

空空如也