- 博客(937)
- 收藏
- 关注

原创 LLM大模型:从新手到专家:AI大模型学习与实践完全指南
大模型,通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑,这些大脑通过阅读大量的文本、图片、声音等信息,学习到了世界的知识。这些大脑(模型)非常大,有的甚至有几千亿个参数,这些参数就像是大脑中的神经元,它们通过复杂的计算来理解和生成语言、图片等。举个例子,你可能听说过GPT-3,它就是一个非常著名的大模型。GPT-3可以通过理解你提出的问题,然后给出回答,或者根据你给它的提示,生成一篇文章、一个故事,甚至是一段代码。
2024-09-06 10:30:00
2714

原创 更高级的 RAG 架构:提升 AI 大模型回答准确性的前沿技术
本文介绍了更高级的 RAG 架构,也详细介绍了更多的 RAG 技术,希望对你有所帮助。RAG 技术依然还在快速发展中,也还存在诸多挑战。前段时间微软发布了 GraphRAG 让 RAG 的应用延伸到了图领域。我相信,在今后 RAG 的应用将会越来越广泛,与 LLM 的结合越来越紧密,我们所使用的 AI 功能也肯定会更加强大。
2024-09-06 09:00:00
1640

原创 深入剖析:从落地场景到实现路径——14份报告揭秘大模型热点问题
生成式AI通过学习大量原始内容,生成新的、原本并不存在的数据、文本、图像或其他类型的内容,具有一定的创造性和想象力。生成式AI对企业带来了创新的机会和自动化的潜力,提高了产品设计、广告创作和个性化服务的水平,使企业能够更高效地自动生成内容、提供个性化的客户体验。2023年是生成式AI的突破时刻,也是中国大模型的发展“元年”。通用大模型的快速迭代推动着生成式AI市场的发展。当前,企业的重点已经从围绕基础大模型的兴奋点转向推动投资回报率的用例。
2024-09-01 12:45:00
2041

原创 从零到精通:详解如何训练大模型的完整指南,非常详细,收藏我这一篇就够了
尽管可以使用一些技巧方法来构造一些看起来特别平滑的指标来反对大模型涌现这个词汇,但是不可否认的事实是,在不同的尺寸变化或者数据量、计算量变化之后,人们可以非常明显地感知到大模型表现的巨大差异,这就是一个相变的结果,就像是炼制一门18连环刃的法器,从第一把的炼制到第18把,从个数的指标上来说是非常平滑的,但是从威力上来说,18把可以构建一个法阵,极大地增加了武器的威力,与之前不可同日而语。以及,另外一个可能,小模型每一层cos都小,有可能每一层在干不同的事,或者每一层都会注意到新的东西。
2024-08-21 22:06:26
2994

原创 【深入探讨】AI大模型的学习路径:理论构建、技术创新与应用实践
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。随着技术的不断进步和理论的不断完善,相信AI大模型学习将会在更多的领域展现出强大的应用潜力,为人类社会带来更多的便利和进步。算法优化是提升模型性能的重要手段。总的来说,AI大模型学习在医疗健康领域的应用将为医疗诊断、治疗和管理带来革命性的变革,有望提高医疗服务的效率和质量,最终造福于人类的健康。
2024-08-16 17:03:58
1740
原创 2025年大模型赛道转型机遇:程序员、产品经理、项目经理们的最佳选择
当今的大经济环境下,AI是少数的上升赛道,虽然商业化曲折,但毕竟寄托了“全村的希望”。不少人跟随潮水的方向,转行到AI行业:深夜求职直播间里,人们问“今年AI赛道值不值得去”,小红书上不少互联网从业者分享如何转到AI产品经理。转行人有着不同面貌:那些想转行、但在风险面前迟疑的,那些下决心抛掉安稳、纵身一跃的,那些在尝试之后又返回原轨的……有人把转行看作在无数分岔路口做出最优解的战争,也有人当作临时起意的漫游。而站在浪头的,是那种并非半途跟风,而是在风口与狂热来临之前,就有勇气在黑暗中独自前行的人。
2025-04-30 20:16:18
666
原创 DeepSeek R1与V3全面对比:选择合适模型,避免走弯路
AI不会淘汰人,但会用AI的人正在淘汰不会正确使用AI的你!从今天起,用对R1和V3,选择合适的模型,让你的工作效率飞跃提升!选择DeepSeek的两款核心模型,帮助你在繁杂的职场任务中游刃有余,成为第一批掌握AI职场制胜法宝的赢家!
2025-04-30 20:14:23
419
原创 AI智能体创建指南:史上最全教程,手把手带你搭建
智能体简介会在首页以及名片页展示,需要简洁明了的介绍智能体用途。用第三人称的角度去说明你的智能体可以解决哪个问题,比如,输入一个课程题目为你生成课程大纲、说出一个主题为你生成一段脚本等。
2025-04-30 20:11:34
681
原创 Ollama本地部署运行全球最强开源大模型 Qwen3
在大型语言模型日益普及的今天,如何在本地设备上轻松运行这些模型成为了许多开发者和技术爱好者关注的问题。Ollama正是为解决这一挑战而生的开源项目,它致力于简化大语言模型(LLM)的本地运行和部署过程,为用户提供了一种轻量级方式,让大家能够在个人电脑上运行各种开源大语言模型。
2025-04-30 20:08:31
474
原创 开发者Day 0上手指南:使用vLLM Ascend 部署 Qwen3
今天阿里巴巴推出了全新一代Qwen大语言模型,在多个方面对Qwen系列进行了升级。其中主要包含2个版本:Qwen3,包括Qwen3-0.6B, Qwen3-1.7B, Qwen3-4B, Qwen3-8BQwen3-MoE,包括Qwen3-MoE-15B-A2B、Qwen3-30B-A3B、Qwen3-235B-A22BQwen3 是 Qwen 系列的最新一代大型语言模型,提供了一系列密集型和专家混合(MoE)模型。
2025-04-30 20:02:37
434
原创 多agent代理的7种设计模式
智能客服中心。当用户提出一个复杂问题时,“协调者”智能体首先理解问题的类型(例如,账单问题、技术故障、产品咨询)。然后,它将该问题“分发”给专门处理该领域的“专家”智能体(如账单专家、技术支持专家、产品知识专家)。协调者不直接解决问题,而是确保问题被路由到最合适的处理者那里,并可能跟踪问题的解决状态。第一个智能体接收原始数据(如销售记录),并验证其格式是否正确、数据是否完整。第二个智能体接收验证后的数据,进行统计分析、计算关键指标(如月度增长率、销售额)。
2025-04-30 20:00:59
336
原创 大模型入门学习必备:四本书让你从新手到专家,非常详细!
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。当前大模型学习的一大误区在于,过于强调工具和技术的掌握,而忽略了底层逻辑的思考。
2025-04-29 22:19:18
751
原创 什么是大模型?初学者学习大模型难吗?学习大模型“难”的点在哪?
当我们提及大模型时,通常指的是大语言模型(Large Language Model,简称LLM),即文字问答模型,其典型代表便是OpenAI的GPT系列。然而,随着技术的日新月异,大模型已经不单单局限于自然语言处理(Natural Language Processing)领域的发光发热,而是逐渐渗透到了其他多个领域。
2025-04-29 22:16:14
867
原创 大模型项目实战指南:从零基础到精通,一篇文掌握全部知识,非常详细收藏这一篇就够了!
我们将开发以大语言模型为功能核心、通过大语言模型的强大理解能力和生成能力、结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。开发大模型相关应用,其技术核心点虽然在大语言模型上,但一般通过调用 API 或开源模型来实现核心的理解与生成,通过 Prompt Enginnering 来实现大语言模型的控制,因此,虽然大模型是深度学习领域的集大成之作,大模型开发却更多是一个工程问题。
2025-04-29 22:12:46
810
原创 斩获86K Star!最强开源MCP平台:双向+本地MCP,自由度极致体验
有半个月没关注它的GitHub了,直到最近我打开一看卧槽,这么快(半个月)就从75K Star干到86K Star了?最关键的是,在最近的1.88.0版本,n8n终于官宣支持MCP了!而且它不仅支持双向MCP,还支持添加本地(stdio)MCP。双向MCP:既可以作为MCP客户端,去添加使用各种MCP-Server。又可以作为MCP服务端,发布MCP-Server供其他客户端使用。MCP-Server目前有两种使用方式,一种是把MCP-Server的工具集成到本地使用,一种是远程调用。
2025-04-29 22:07:51
772
原创 阿里巴巴Qwen3抢先DeepSeek R2发布:登顶全球最强开源模型
Qwen3千呼万唤始出来,直接登顶全球最强开源模型。4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),旗舰模型Qwen3-235B-A22B参数量仅为DeepSeek-R1的1/3,总参数量235B,激活仅需22B,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。
2025-04-29 22:04:55
648
原创 国内开源LLM荣耀之光Qwen3系列,非常详细收藏我这一篇就够了
qwen3:32b在文化沉浸感与心理疏导有效性上表现更优,其通过构建历史人物对话场景,将文化记忆转化为疗愈资源的设计尤为精妙。gemma3:27b虽在诗意表达上有亮点,但存在典故挪用稍显生硬、建议维度单一等问题。二者共同展现了传统文化在当代心理调适中的独特价值,qwen3:32b更胜在实现了历史智慧与现代心理学的有机融合。
2025-04-29 22:02:50
485
原创 AI大模型入门超详细教程:基础知识点全覆盖,AI大模型学习路线,非常详细收藏我这一篇就够了!
AI大模型即通过大量文本数据和计算数据训练出来的人工智能模型,具有持续学习和适应的能力,与传统AI模型相比,AI大模型在准确率、泛化能力和应用场景方面具有显著优势。
2025-04-28 12:49:45
1054
原创 GAN生成对抗网络深度解析:神经网络算法全攻略
本文将从三个方面,带您一文搞懂GAN的本质GAN架构一、生成器(Generator)功能:负责生成新的数据样本。结构:通常是一个深度神经网络,输入为低维向量(如随机噪声),输出为高维向量(如图片、文本或语音)。训练目标:生成尽可能真实的数据,以欺骗判别器。二、判别器(Discriminator)功能:负责区分输入的数据是真实数据还是由生成器生成的假数据。结构:同样是一个深度神经网络,输入为高维向量(如图片、文本或语音),输出为一个标量,表示输入数据的真实性概率。
2025-04-28 12:43:55
757
原创 构建康养领域AI智能体的系统化路径:技术架构、应用场景与未来展望
随着全球老龄化进程加速和健康意识提升,康养产业正面临服务需求激增与专业资源短缺的双重挑战。AI智能体技术作为人工智能领域的前沿方向,为康养服务提供了智能化升级的创新解决方案。本文将从技术架构设计、核心功能实现、应用场景落地、伦理安全考量及未来发展趋势五个维度,系统阐述康养领域AI智能体的构建方法。构建康养领域的AI智能体需要基于模块化、可扩展的架构理念,充分考虑康养场景的特殊性需求。分层递进的技术架构能够有效整合感知、认知、决策与执行等多个功能模块,形成完整的“感知-思考-行动”闭环。
2025-04-28 12:40:51
773
原创 揭秘 RAG:为什么说它是让大语言模型(LLM)更聪明的秘密武器?
简单来说,RAG 就是给聪明但可能信息滞后或“爱瞎猜”的大语言模型(LLM)配上了一个强大的外部搜索引擎和资料库。RAG = 智能检索 (找对、找全资料) + 智能生成 (用好资料、说人话)它让 AI 在回答问题前,先做“功课”(检索),再结合“功课”和自己的知识来回答,使得答案更准确、更可靠、更与时俱进,还能利用私有或特定领域的知识。这使得 AI 在很多实际应用场景中变得更加强大和值得信赖。
2025-04-28 12:38:54
723
原创 AI营养师:通过知识图谱和大模型为用户提供健康饮食指导 - 东京大学&MIT等
摘要寻求饮食指导通常需要在理解复杂专业知识的同时,应考虑到个人的健康状况。知识图谱(KGs)提供了结构化且可解释的营养信息,而大型语言模型(LLMs)自然促进了对话式推荐信息的传递。本文介绍了HealthGenie,一个基于交互式系统AI营养师,它结合了LLMs和KGs的优势,提供个性化的饮食建议以及层次化的信息可视化,以便快速直观地概览。在接收到用户查询后,HealthGenie会进行查询细化,并从预先构建的KG中检索相关信息。
2025-04-28 12:32:50
717
原创 让浏览器拥有思考力:LLM+Playwright实现自主行动的智能助手
创建状态图# 添加节点# 添加边和条件边"end": END# 更多边定义...当浏览器拥有思考能力,它不再只是信息世界的窗口,而成为我们的智能助手和得力搭档。这不仅仅是技术上的进步,更代表着人机交互范式的革新 —— 我们不再需要适应机器的工作方式,而是让机器理解并适应我们的意图和需求。在不久的将来,或许我们会惊讶地发现,曾经需要我们手动完成的繁琐网络任务,现在只需一句简单的指令,就能由这位"会思考的浏览器助手"优雅地完成。这就是AI赋能的魅力,也是笔者想着去尝试创建这个系统的初衷。
2025-04-28 12:31:08
791
原创 一张图说明AI智能体的底层框架逻辑
AI智能体是什么,有很多解释,我们用一个简单的逻辑说明一下,智能体 = 能干事的“小帮手”想象你有一个小助手,它能帮你完成任务,而且自己会动脑子!它可能是:a、🤖 机器人(比如扫地机器人,看到垃圾就吸走)。b、📱 手机里的软件(比如天气预报App,自动告诉你明天要不要带伞)。c、🎮 游戏里的角色(比如《我的世界》的村民,自己种地、买卖东西)。智能体能够感知环境、分析信息、做出决策并执行任务。它可以是虚拟助手、聊天机器人、自动化工具,甚至是物理机器人。
2025-04-28 12:29:18
703
原创 微信深度应用指南:三种方式玩转DeepSeek,不容错过!
微信接入了DeepSeek,全网沸腾,有网友评论说:这是你被微信的灰度测试邀请了吗?首先是有幸参与灰度测试的朋友们,恭喜你们:从2月15日开始,微信开始小规模的测试接入deep seek,目前只有一部分用户可以使用微信ai搜索。操作路径:打开微信聊天页顶部搜索框 → 点击“AI搜索”按钮 → 选择“深度思考-R1”思考过程可视化:举例,输入“北京五日游攻略”,AI会分步骤展示景点筛选、交通规划等逻辑,如同专业导游带路;社交化分享:支持将完整对话记录转发给好友或朋友圈,知识共享更便捷;
2025-04-28 00:04:18
1350
原创 【旅游业垂类大模型】旅游行业创新突破!实测首个垂直大模型,效果惊人
当前生成式AI(AIGC)领域激烈的竞争环境下,从大厂到中小企业,再到创业者和机构,都在积极投身于这片新蓝海,希望在竞争中占据先机。业界逐渐认识到,大模型的价值实现依赖于其在各行各业的应用落地,特别是在与垂直行业的深度融合中。因此,行业大模型逐渐取代通用大模型,成为新的发展趋势。携程集团发布了“携程问道”,旨在聚焦全球旅游行业,通过AI技术提供全方位的智能助手服务,涵盖旅行前、中、后各个阶段。行业场景为大模型提供了理想的实践舞台。与通用大模型相比,行业大模型必须针对。
2025-04-28 00:02:02
754
原创 AI大模型产品经理学习指南:【2025全新版LLM大模型产品经理学习路线】非常详细,收藏我这一篇就够!
随着人工智能技术的蓬勃发展,尤其是大模型(Large Model)的强势兴起,越来越多的企业对这一领域愈发重视并加大投入。作为大模型产品经理,需具备一系列跨学科的知识与技能,方能有效地推动产品的开发、优化以及市场化进程。以下是一份详尽的大模型产品经理学习路线,旨在助力你构建所需的知识体系,实现从零基础到精通的蜕变。一、基础知识阶段(一)计算机科学基础数据结构与算法:深入理解基本的数据结构(如数组、链表、树、图等)以及常用算法(如排序、查找、递归等)。
2025-04-27 23:59:17
947
原创 AI 迈向通用人工智能 (AGI) 的路线图
路线图”一词指的是绘制一条线性路径,即一系列应按顺序执行和完成的步骤。这并非完全错误,但它未能认识到研究中的不确定性和机遇。我们下面概述的步骤除了从头到尾的顺序之外,还具有多重相互依赖性。路线图建议的顺序虽然自然,但在实践中往往会被偏离。有用的研究可以通过进入或附加到任何步骤来完成。例如,我们中的许多人最近在集成架构方面取得了有趣的进展,尽管这些进展仅出现在顺序的最后几步。首先,让我们尝试对路线图及其基本原理有一个整体的了解。共有 12 个步骤,标题如下:1. 表征 I:基于给定特征的持续监督学习。
2025-04-27 23:56:06
938
原创 Dify元数据商业应用,知识库权限分级实战(内附全流程配置手册,建议收藏)
在当今信息爆炸的时代,企业内部的知识管理变得尤为重要。如何高效地组织、检索和利用海量的文档资源,是每个企业都需要面对的挑战。Dify平台作为一款强大的知识管理工具,提供了功能来帮助企业实现文档的精细化管理和智能检索。本文将通过一个具体的案例,详细介绍如何使用Dify平台创建知识库、设置元数据、配置工作流,并通过测试来验证元数据的应用。无论您是企业的知识管理专员,还是对Dify平台感兴趣的技术爱好者,相信本文都将为您提供实用的指导和启发。
2025-04-27 23:52:17
924
原创 GraphRAG如何用于Agent做memory记忆管理?Graphiti实现解读及相关技术进展回顾
上,GraphRAG不支持自定义实体类型;Graphiti支持自定义实体类型,适用于特定应用领域的精确知识表示。在。
2025-04-27 23:50:25
718
原创 大模型课程资源汇总:零基础入门到精通,非常详细收藏我这一篇就够了!
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
2025-04-25 20:44:40
850
原创 DeepSeek R1知识库搭建指南:打造智能知识库,全程干货喂饭级教学!
今天来讲讲,本地部署DeepSeek一个重要应用场景:搭建AI知识库。知识库的好处好处1:数据在本地电脑上,保护数据安全和个人隐私,对于企业来说尤为重要。好处2:通用大模型(比如ChatGPT)缺少垂直领域的知识,每次前提问都需要提供背景信息,上传相关资料,才可以得到相对高质量回答。而本地模型+知识库的模式,简单的提问就可以很容易得到垂直定制化,且精准的高质量回答。好处3:使用时间越长,知识库越丰富,回答质量越高,形成正循环。好处4:不需要联网,即使官方宕机甚至断网也能正常使用。安装Dify。
2025-04-25 20:42:52
1269
原创 大模型数据合成与增强技术最新综述:深入解析前沿方法!
大型语言模型(LLMs)高质量数据的增长速度远远落后于训练数据集的扩张,在这种情况下,合成数据已成为一个有希望的解决方案。。全面回顾并总结了,包括。。先前的调查主要关注基于大型语言模型(LLM)的数据合成和增强方法,旨在支持下游任务。相比之下,我们的工作强调以LLM为导向的数据合成和增强,系统地涵盖了LLM的完整生命周期——从数据准备到应用——并解决核心LLM功能,如理解和生成,最终目标是通过以数据为中心的技术来改进LLM本身。数据增强与合成。
2025-04-25 20:40:27
826
原创 AI应用我也迷茫....直到我发现LangChain
在成为一名AI应用工程师之前,我和很多同行一样,面临着职场中的迷茫期。曾经,我也只是一名Java程序员,面对日益复杂的开发任务和日趋激烈的行业竞争,我感到自己不断陷入瓶颈。作为一名程序员,我曾以为只要学会几种编程语言,做好代码,就能够应对各种开发任务。但随着AI技术的崛起,我逐渐意识到,光靠传统的编程技能已经不足以满足市场和项目的需求。那段时间,我不仅遇到了技术上的困惑,还感到自己在职业发展的道路上遇到了瓶颈。每天写着重复的代码,处理一些简单的任务,却无法突破自我,做出更具挑战性和创新性的项目。
2025-04-25 20:23:25
815
原创 3天狂揽2.8k星!manus 开源替代又又又又又又又来啦! 逆天AI助理Suna开源!免费替你搞定一切,效率飙升!
今天给大家挖来一个超级宝藏!🚀 你是不是也曾幻想过拥有一个钢铁侠的贾维斯那样,能帮你处理各种繁琐任务的AI伙伴?能在你忙得焦头烂额时,优雅地帮你完成研究、分析数据、甚至处理各种日常挑战?别再幻想了!今天的主角——,就是这样一个为你而生的开源通用AI智能体!它不仅仅是一个聊天机器人,更是一个能行动、解决现实世界问题的得力干(工)助(具)手(人)!在GitHub上,光发布几天的Suna项目已经吸引了 2.8k 颗星星 (Stars)!而且增长速度非常快,可以说是“光速”蹿红,足以证明它的魅力和潜力有多大!
2025-04-25 20:22:12
758
原创 30+程序员转行大模型,抓住AI风口,非常详细收藏我这一篇就够了!
作为一位30+北漂男程序员,2个月零基础转行大模型,成功拿下我,开启了我的大学生活。因为听学长学姐说我们专业毕业了也是比较累的,但是我当时励志在北京创出一番事业来,所以我觉得其实都还好。后来我留在北京工作生活,,天天在高级写字楼工作,我想很多人都会很高兴在北京获得一份在高级写字楼里的工作,我也不例外,但是我到这里按年算起来,这十年来我从一个基层码农到现在的中层,月薪也涨到了2w+,一直以来我都是一个对生活没有什么特殊要求的人。
2025-04-24 15:41:49
826
原创 2024年大模型论文精选:微调、Transformer与混合模型热门话题全解析!
今天分享10篇最近刚刚公布的论文,涉及大模型微调、Transformer替换、LoRA、实体关系抽取、大模型幻觉等热门研究方向。其中关于将多个模型协同混合可媲美ChatGPT,论文特别有意思。
2025-04-24 15:39:58
743
原创 LLM大模型神仙入门书籍教程分享!全网爆火神书《从零构建大模型》终于有中文版的啦!非常详细收藏这一篇就够了
从零构建大模型》这本书主要使用的是 pytorch 框架,而不是依靠各种库。通过它,不仅可以掌握 LLM 的理论知识,还能通过动手实践,学习如何从头构建一个功能强大的语言模型。这本书从大模型的基础知识讲起,从内到外地分析大模型的工作原理,并用清晰的文本、图表和示例解释,引导读者逐步创建属于自己的大模型。
2025-04-24 15:37:45
446
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人