一顿码-CSDN博客

原创大语言模型（LLM）最佳学习路线、代码、论文，全汇总！产品经理、程序员、转行必看！

AI趋势势不可挡，风口来了！无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套资料涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。

2024-06-27 14:59:12 1092

原创错过再等一年！ComfyUI教程视频工作流+FLUX模型安装包，AI合集价值1W+

想学comfyui、stable diffusion、MJ的，我给给大家出一篇保姆级指南和课程,带你从0拿捏AI绘画全流程,附赠"万能提示词公式"和"避坑指南",看完直接上手!赠送SD提示词、插件、模型、实战案例12000+AI关键词大合集!

2025-04-29 09:38:58 463

原创 AI绘画，徒手搭建工作流，ComfyUI入门教程，教你一步一步搭建文生图工作流

初识ComfyUI的工作界面，是一个非常朴素的工作场景，它的工作区域被几个用不同颜色连接起来的功能组件占据，这些组件就是”节点“。按住鼠标左键可以对场景进行平移，滚动滑轮可以对场景进行缩放。

2025-04-22 10:20:06 946

原创 AI绘画，ComfyUI翻译插件和节点使用小技巧

先来看下出图效果，这是一个 Flux 基础工作流，里面用到了一个翻译插件，允许我们通过直接输入中文提示词来生成画面这个插件能够自动将中文提示词转换成英文提示词，再也不用担心不会写英文提示词了。今天我们来介绍这个翻译插件的使用技巧。

2025-04-22 10:14:54 1550

原创大模型基础知识汇总（非常详细）零基础入门到精通，收藏这篇就够了【Deepseek】

本文整理了大模型基础知识点近100个名词解释，并按照1. LLM（大语言模型, Large Language Model）：基于海量文本数据训练的深度学习模型，如GPT系列、BERT等，能够理解和生成自然语言文本，能够进行复杂对话、文本创作等任务。2. AGI（通用人工智能, Artificial General Intelligence）：这是AI研究的理想目标，追求创造能像人类一样学习新技能、解决广泛问题的智能体，目前仍处于理论探索和初步实践阶段。

2025-04-03 09:26:53 1554

原创 DeepSeek模型在中文语境下的安全性评估

此外，其低成本的训练和部署策略加速了DeepSeek-R1在全球的应用。这些辅助模型包括来自4个不同系列的10个大语言模型：百川系列（Baichuan2-7B-Chat、Baichuan2-13B-Chat）、ChatGLM系列（ChatGLM3-6B）、Qwen系列（Qwen1.5-7B-Chat、Qwen1.5-14B-Chat、Qwen1.5-32B-Chat、Qwen1.5-72B-Chat、Qwen1.5-110B-Chat）以及Yi系列（Yi-6B-Chat、Yi-34B-Chat）。

2025-02-22 17:26:42 739

原创清华大学：DeepSeek从入门到精通（2025）

DeepSeek 坚定开源路线，密集更新 MoE、推理、多模态模型。近期，DeepSeek 连续发布并开源多个大模型，其低成本、高性能的特性迅速引发全球用户的关注。未完待续，请参考完整版报告，关注主页，获取更多内容......

2025-02-22 17:24:12 252

原创 DeepSeek人工智能：大模型概念、技术与应用实践（2025）

在数字化浪潮汹涌澎湃的当下，大模型如同一颗璀璨新星，强势崛起并迅速成为科技领域的焦点。从最初的理论探索到如今在各个行业的广泛应用，大模型正以惊人的速度重塑着我们的生活与工作模式。它不仅是人工智能技术发展的重大突破，更是推动经济增长、提升社会治理效能、促进科技创新的关键力量。本文将深入剖析大模型的核心概念、原理特点以及丰富多元的应用实践案例，旨在让大家全面了解大模型这一前沿技术，明晰其在当下及未来发展中的重要地位与深远影响，共同探索如何借助大模型的力量推动社会各项事业迈向新的高度。

2025-02-22 17:20:59 375

原创大模型入门好书推荐 - 《大规模语言模型：从理论到实践》附PDF版

预训练阶段：介绍了如何利用包含数千亿甚至数万亿单词的训练数据，并借助超级计算机进行深度神经网络参数的训练。同时，探讨了如何构建训练数据以及高效地进行分布式训练。有监督微调阶段：讲解了如何利用少量高质量的数据集，通过提示学习和语境学习等方法，将语言模型转变为对话模型。这一阶段的难点在于如何构建训练数据及其内部关系。奖励建模和强化学习阶段：介绍了如何根据用户提示词，利用奖励模型评估模型补全结果的质量，并通过强化学习进一步优化模型性能。该阶段需要解决强化学习方法稳定性不高、超参数众多及模型收敛困难等问。

2025-02-05 09:53:58 1269

原创【DeepSeek Janus Pro】重磅开源！文生图+图像识别，统一多模态大模型奠基之作！帮你赚钱的几个路径

很多AI我都体验过，从chatGPT、midjourney到豆包、Kimi、即梦……多亏有了AI，才让我们在面对老板的无厘头要求时，从容应对。

2025-02-05 09:39:58 2031

原创手把手教你在本地部署 DeepSeek R1，并集成到 Dify 中，建议收藏！

一步步指导你如何在本地环境中安装 DeepSeek R1，并将其融合进 Dify 中，确保你的工作的效率得到实质性的提升！本部分内容将重点阐述如何在本地环境下利用 Ollama 来部署 DeepSeek R1。后续章节将详细讲解如何将 DeepSeek R1 与 Dify 系统进行集成。请访问 Ollama 的官方网站，根据你的操作系统选择合适的版本，下载 Ollama应用程序并进行安装：安装完成后，打开命令行界面并输入ollama命令。

2025-02-04 11:08:21 1562

原创大模型入门学习：一分钟了解大模型的基础概念知识

Pipeline 并行（流水线并行）：将模型的不同层分布在多个设备上，形成一个处理流水线，这样每一部分只需要存储和处理模型的部分参数。张量并行：针对大规模张量操作，将其分解并在多个GPU上并行执行，例如，对于大的矩阵乘法操作，可以将矩阵沿某一维度切分后在多GPU上进行并行计算。混合并行：结合数据并行与模型并行，根据模型结构特点灵活应用。

2025-01-22 10:24:33 978

原创先看懂这本LLM完全手册，你就算大模型入门了！

2022年底，ChatGPT 震撼上线，大语言模型技术迅速“席卷”了整个社会，人工智能技术因此迎来了一次重要进展。中国人民大学在 arXiv 网站发布了英文版大语言模型综述文章《A Survey of Large Language Models》，该综述文章系统性地梳理了大语言模型的研究进展与核心技术，讨论了大量的相关工作。同时，为了促进大模型知识在中文社区的传播，推动中文大模型研究，中国人民大学对英文版进行了翻译校对，推出了首个中文版大语言模型综述！

2024-11-28 13:46:56 263

原创 AI Agent给了企业新出路，但这条路并不好走

大模型的引入，可以增强RPA的功能，使其不仅能够理解和生成自然语言，还能自动创建内容、改进决策，甚至生成代码，从而为客户提供更多价值，提高生产力和效率。智能体之间的协作方式类似于人类的工作模式，它们能够主动分配任务，按照既定的标准流程操作，并具备自我监督的能力，以确保工作质量和效率。从AI行业角度来看，尽管AI Agent应用仍然处于早期发展阶段，但中国市场的多样性为AI Agent提供了丰富的应用场景和数据资源，国内AI企业可以充分利用这些天然优势，开发出更加符合本土市场需求的AI Agent产品。

2024-11-26 09:53:47 942

原创人人都在学的智能体（AI Agent），老司机带你轻松入门

我们来看看最早技术上的定义。

2024-11-25 17:57:51 1502

原创 14 天速成 LLM 高手！免费分享大佬开源笔记，GitHub 狂揽 700 星

学习路线中的主要知识点包含：token 嵌入、位置嵌入、自注意力、Transformer、对 Q、K、V 的直观理解、因果和多头注意力、温度、top - k、top - p、分类和指令微调、旋转位置编码（RoPE）、KV 缓存、无限注意力（长上下文窗口）、专家混合（MoE）、分组查询注意力（grouped query attention）、llama - 2 架构及相关技术等。幻觉是指模型生成的文本与现实世界的事实或用户输入不一致的现象，对于研究人员和使用 LLM 构建应用的人来说，都是一个巨大的挑战。

2024-11-19 11:21:57 639

原创 AI新时代序幕！大模型研究报告（附AI名词详解）

但是现在，有了AI大模型，我们可以通过模型微调的手段，基于超大规模基模型，打造出领域大模型或者行业大模型，进而覆盖更多行业自场景。而且，AI大模型不仅能生成代码，还能补全必要的代码块，保证一定的准确率。比如说，ChatGPT就是一个基于AI大模型研发的人工智能聊天机器人，它能够理解我们的语言，回答我们的问题，甚至还能进行对话和写作。比如说，GPT系列模型在自然语言处理领域的多个任务中都取得了非常好的表现，而BloombergGPT则是专门为金融领域开发的一种语言模型，可以更好地处理金融领域的数据和任务。

2024-11-19 10:48:26 1443

原创 2024年中国AI大模型场景探索及产业应用调研报告：大模型“引爆”行业新一轮变革

投资机会包括算力芯片、细分产品、细分市场和应用领域，风险包括基础算力不足、人才缺乏、数据获取成本高和法规风险。技术趋势包括预测大模型、决策大模型和具身智能大模型，竞争趋势表现为资源聚焦单一发展路径。企业主要通过深化通用大模型能力或打造垂类行业大模型提供服务，商业模式灵活多元化。报告预测，到2028年中国AI大模型行业的市场规模将突破千亿元，行业前景巨大。AI大模型提升各行业生产要素的产出效率，提高数据要素在生产要素组合中的地位。金融、电商、教育和医疗领域是未来五年AI大模型应用潜力最高的四大下游行业。

2024-11-19 09:43:08 396

原创阿里内部消息：互联网巨头豪赌AI Agent，背后秘密大曝光！

阿里千问的 P10 的一位老哥交流，提到接下来开发者必须掌握的技能，他斩钉截铁的说“要懂大模型，更要懂 AI Agent”。，我能正在经历一场重大技术变革，还不像当年的互联网的兴起，这是一场颠覆性的变革，掉队就等于淘汰，因为未来所有应用都将被AI Agent重写一遍；，先入场的同学至少会享受4~5年的红利，拿高薪，并且会掌握更多的资源。

2024-11-18 11:23:21 578

原创五大主流开源大模型RAG评估框架详解

AI Agent 足够重要，但也足够复杂，我这两年的实践的结论是，想开发出一个能够可靠稳定的 Agent 应用实在太难了，大模型技术本身的复杂度，大模型推理的不确定性等等，这些困难直接导致很人对其望而却步，或是遇到问题无从下手。最近两年一直在研究大模型应用技术，大模型的价值太大了，AI Agent 的潜力太大了，“未来所有应用都将被 AI Agent 重写一遍”这句话也是今天听到最多的一句话。利用这些功能，用户能够对不同 LLM 大模型的输出进行详细比较，识别各自的优势与不足，进而挑选出最合适的大模型。

2024-11-18 11:10:10 2253

原创别再手动编排工作流了，AI做的比你更好！

这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。让我们将 AFLOW 的优化过程比作探索一道新佳肴的旅程，就像精心调配食材一样，AFLOW 也在逐步调整工作流程，直至呈现出最令人满意的结果。AFLOW 的目标是在特定任务中，寻找表现最佳的工作流程，这些任务可能包括解决数学问题、根据需求编写代码，或是进行长文本的多步骤推理。短期内，答案是否定的。随着时间的推移，AFLOW 的烹饪日记越来越丰富，它的“厨艺”也日益精进。

2024-11-18 11:04:57 1311

原创 AI绘画美女指令大全，5个技巧让你的画作惊艳四座，美得令人窒息

你是不是曾梦想过自己也能创作出如画美景般的美女形象，却苦于手边的画笔无法达成心中所愿？在这个科技飞速发展的时代，AI绘画技术已经悄然走进了我们的生活，让每一个普通人都能成为艺术大师。你可能会问，AI绘画真的能做到如此惊艳的效果吗？今天，我们就一起来揭示这背后的秘密，分享5个技巧，让你的画作美得令人窒息。

2024-09-26 11:51:40 1964

原创 Midjourney高清指令：3个技巧让你的AI绘画更清晰细腻，惊艳众人

别担心，今天我就带你一起探究如何利用Midjourney的高清指令，让你的AI绘画作品更加惊艳，吸引所有人的目光。别停留在理论上，赶紧打开Midjourney，亲自试验一下这些指令，看看你能创造出怎样的惊艳作品！原因很简单，分辨率越高，细节表现越丰富，绘画效果自然更加细腻。Midjourney提供了一些高级指令可以帮助你调整纹理和细节，让你的作品更加精美。Midjourney提供了丰富的调色选项和光照效果，可以让你的作品更加生动。通过设置特定的调色板，你可以控制画作的整体色调，让作品看起来更协调。

2024-09-26 11:39:58 2119

原创 AI绘画:Stable Diffusion 终极炼丹宝典:从入门到精通

现阶段，AIGC（人工智能生成内容）领域主要有两大热门趋势，Stable Diffusion因其开源免费的特性和高度灵活的定制性而备受青睐，尤其吸引那些热衷于探索和创新的人群。在互联网大厂中，AIGC 已经展现出强大的应用潜力。无论是内容创作、智能客服，还是数据分析、代码生成，AIGC 都大显身手。此外，众多科技企业也在积极孵化 AIGC 项目，互联网巨头纷纷推出相关岗位，不论是技术还是产品、运营、设计，争相占领这一技术高地。（boss直聘AIGC相关高薪岗位）在AI绘图领域，

2024-09-13 10:39:24 950

原创一文看懂开源许可证：大语言模型和向量数据库入门指南

开源许可证是 AI 中协作开发和创新的基石，定义了开源软件访问、使用和分发的边界。ASF 主要以开发广泛使用的软件项目如 Apache Hadoop 和 Apache Kafka 而闻名，它提供了一个开放和去中心化发展的框架，并采用宽松的许可模型。社区参与有助于维护开源生态系统内的互信、透明度和共识，促进创新和增长，同时保持开源软件的完整性。假设一家提供开源软件的公司突然关闭源代码或使用具有更多限制的许可证，那么利用最后一个开源版本代码的企业就不得不承担维护代码和开发新功能的重担。

2024-08-02 17:51:09 731

原创大模型应用落地：如何选择合适的 Embedding 模型？

OpenAI 的创新工具 Sora，则在文本到视频的生成领域展现了非凡能力，与 Dall-E 在图像生成领域的成就相似，Sora 仅需用户输入文本提示，即可借助强大的 LLM 生成对应的视频内容。该模型不仅在排名上表现抢眼，而且以其较小的体积适合在有限资源的设备上运行，此外，模型卡片提供的博客和论文链接也增加了其透明度和可信度。至于多模态文本-视频的 RAG 应用，则采取了类似的策略，先将复杂的视频内容简化为可处理的文本描述，经 Embedding 转化后执行文本查询，最后输出相关的视频片段作为检索成果。

2024-08-02 17:49:21 989

原创 RAG 的尽头是 Agent？

Naive RAG（基于检索的增强生成）应用主要是在整合自身知识库的基础上，提升大型模型的性能，以产出更精准、即时和丰富的行业内容或定制化信息。信息转换：{“英文关键词”: [“bicycles”, “invention”, “timing”], “中文关键词”: [“自行车”, “发明”, “时间”]}。用户输入示例：“请用2000字的篇幅详细说明，我的问题是，自行车是什么时候发明的？因此，我们的大模型应用也将从 RAG 迈向 Agent，可以说，Agent 是 RAG 发展的必然归宿。

2024-08-02 17:42:32 967

原创 RAG 开发四大痛点及解决方案

收录了52个优秀的大模型落地应用案例，这些案例覆盖了金融、医疗、教育、交通、制造等众多领域，无论是对于大模型技术的研究者，还是对于希望了解大模型技术在实际业务中如何应用的业内人士，都具有很高的参考价值。在最初的 RAG 方法中，比较类型的问题表现尤为不佳。观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

2024-07-31 10:09:16 1117

原创基于LLM的搜索排序

滑动窗口重排序次数的影响：表中的方法(3)(4)显示进行多次重排序可能会提高nDCG@10，但会损害nDCG@1排序性能（例如，nDCG@1下降了3.88）。滑动窗口的方案简单，不过笔者认为从全局来看，该方案不太公平，因为不同段落之间的排序未必存在偏序传递关系：图中p4和p5未必比p6和p7更优。对第二个问题，文章采用蒸馏技术，以在更小的专用排序模型中模仿ChatGPT的段落排序能力。文章的方案是最后一个，将一组段落输入到LLM，每个段落都有一个唯一的标识符（例如，[1]，[2]，等）。

2024-07-30 11:26:43 1016

原创解锁LLM应用潜能：提示工程的39种方法与应用全解析！

大型语言模型（LLMs）在许多不同的自然语言处理（NLP）任务上表现出了显著的性能。提示工程在提升LLMs已有能力方面发挥着关键作用，使其在各种NLP任务上取得了显著的性能提升。提示工程需要编写自然语言指令，即提示，以结构化的方式从LLMs中提取知识。与以往的最先进（SoTA）模型不同，提示工程不需要根据给定的NLP任务进行广泛的参数重新训练或微调，而是仅依赖于LLMs的内嵌知识。此外，LLMs的爱好者可以通过基本的自然语言对话交换或提示工程，智能地提取LLMs的知识，使得越来越多的人即使没有深厚的数学机器

2024-07-30 11:23:34 1042

原创什么是机器学习

而有了机器学习，你只需要给电脑大量的猫和狗的图片，告诉它哪些是猫，哪些是狗，然后它自己就能“学习”到这些特征，下次再给它一张新图片，它就能猜出来这是猫还是狗了。最近几年，人工智能领域的“大模型”火得一塌糊涂，比如OpenAI的GPT-4，百度的文心一言、阿里的通义千问等，这些模型拥有超强的学习和推理能力，能生成自然语言、回答问题、作诗写歌、生成创意图片。强化学习就像是你在玩一个复杂的网络游戏，没有别人来教你具体该怎么做，但是每次你做出一个操作，游戏都会给你反馈：要么得分（奖励），要么扣分（惩罚）。

2024-07-30 10:58:10 526

原创赶超 GPT-4o，最强大模型 Llama 3.1 405B 一夜封神，扎克伯格：开源引领新时代

为了实现这种规模的训练并在短时间内达到预期的效果，研究团队优化了整个训练堆栈，在超过 16000 个 H100 GPU 上进行训练，这也是第一个在如此大规模上训练的 Llama 模型。通过监督微调、拒绝采样和直接偏好优化等方法，在预训练模型基础上进行多轮对齐，构建聊天模型，Llama 3.1 405B 也能够更精确地适应特定的使用场景和用户需求，提高实际应用的表现。简单来说，超大杯 Llama 3.1 405B 是 Meta 迄今为止最强大的模型，也是全球目前最强大的开源大模型，更是全球最强的大模型。

2024-07-29 11:16:36 903

原创 AI+技术 | 一文读懂以LLM为核心的AI Agent的架构指南

控制端处于核心地位，大脑模块承担记忆、思考以及决策制定等基础工作，感知模块则负责接受和处理来自外部环境的多样化信息，如声音、文字、图像、位置等，最后，行动模块通过生成文本、API调用、使用工具等方式来执行任务以及改变环境。该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

2024-07-29 10:49:44 1388

原创 AI应用 | 【AI+工业】LLM（大型语言模型）在工业领域中的十个应用

同样在 6 月，Cognite 推出了 Copilot 产品，利用 LLM 的自然交流能力，将其作为通用的低代码接口，连接到其解决方案的最先进功能，从而为更多的一线工人、数据科学家、设施管理人员和高管提供了通过他们喜欢的媒介与关键信息进行交互的能力。虽然即使是当今最强大的 LLM（如 GPT-4 和 Claude）有时也会犯错，但如果利用适当的软件支架来引导他们的注意力，他们对世界的一般知识就能为操作员、经理和工程师提供快速、无需判断的理智检查，或对关键决策提供第二意见（见图4）。

2024-07-29 10:33:20 1176

原创科普贴：什么是大模型？快速了解大模型基本概念

随着技术的不断进步，大模型将在未来的智能社会中扮演更加重要的角色，为人类社会带来更多的可能性。想象一下，如果你的大脑能够记住整个图书馆的所有书籍，并且能够理解每本书的内容，那么你就拥有了类似大模型的能力。大模型是人工智能领域的一种机器学习模型，它们通过学习大量的数据，获得了类似于人类理解语言、图像和声音的能力。那么，什么是大模型呢？我们学习AI大模型必然是想找到高薪的工作，下面这些面试题都是总结当前最新、最热、最高频的面试题，并且每道题都有详细的答案，面试前刷完这套面试题资料，小小offer，不在话下。

2024-07-29 10:29:30 1234

Stable Diffusion 新手入门教程，安装使用及模型下载

空空如也