自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(988)
  • 收藏
  • 关注

原创 最强推理模型一夜易主!o3-pro 碾压 Gemini 2.5 Pro,o3 降价80%

昨夜,OpenAI 正式发布 o3 推理模型的升级版,又是一个“史上最强推理模型”!总的来说,o3-pro 比 o3 强太多了,在科学、编程和写作等关键领域表现卓越,专家评估胜率远超 o3,用户实测反馈其速度更快、成本更低且精准度惊人。在专家评估中,评审员在每个测试类别中均一致偏好 o3-pro,。与 OpenAI o1-pro 一样,。在评估模型数学能力的 AIME 2024 测试中,o3-pro 的表现优于谷歌顶级模型 Gemini 2.5 Pro。

2025-06-12 11:07:38 474

原创 训推大模型,为何应该先彩排?

随着新型应用快速变化(细粒度MoE、原生多模态、生成式推荐、Agentic AI、Physical AI、互联网AI),系统架构持续创新(PIM/NDP、Wafer-Scale Computing、集群池化系统、光电混合系统),未来算力基础设施的架构设计与优化空间持续激增,需要建模仿真方法支撑算力基础设施的持续演进。

2025-06-12 10:09:55 390

原创 OpenAI o3-pro震撼发布!碾压o1-pro,数学、科学、编程全能王者,立即体验!

在专家评估中,评论者一致认为OpenAI o3-pro优于o3,强调其在关键领域(包括科学、教育、编程、数据分析和写作)的性能显著提升。评论者还一致评定o3-pro在清晰度、全面性、指令遵循能力和准确性方面表现更优。与OpenAI o1-pro类似,OpenAI o3-pro在数学、科学和编程方面表现出色,这一点在学术评估中得到了体现。OpenAI o3-pro的主要优势通过我们严格的“4/4可靠性”评估得以体现,该评估要求模型在四次尝试中均正确回答问题,而非仅一次正确即算成功。

2025-06-11 11:27:01 202

原创 这才是2025年最全最细的AI产品经理教程,从零到精通,字节大佬整理的内部版,通俗易懂,学完即就业!!

文章介绍了AI产品经理如何从0到1打造一款AI产品。整个过程,分为三个大的阶段,包括:项目启动、项目实施、项目上线。在项目启动阶段,AI产品经理需要制定产品上线倒排计划,明确每个时间点产品可以上线的功能,可以达到的效果,从而倒逼确定相应的人、财、物。在项目实施阶段,需构建DMP数据管理平台,再根据有效的样本数据制定模型,并且构建推荐引擎。在项目上线阶段,先通过AB测试,明确最优产品策略,再进行放量上线,最后通过上线后的产品运营情况、用户反馈,对产品进行逐步迭代优化。

2025-06-10 11:34:38 960

原创 2025最新AI模型产品经理学习路线!看这一篇就够了!

市面上不同的公司对产品经理的定位有很大的差别,一名合格的产品经理是能对软件产品整个生命周期负责的人。AI产品经理和通用型软件产品经理的底层思考框架是一样的,都是要经历产品立项、需求分析、产品设计、产品执行管理(研发测试)、验收、分析迭代这几个阶段。:通用型产品经理,只需要把业务流程、痛点理清楚,在进行逻辑处理、界面流程化,软件化即可。而AI产品是AI技术为出发点,为各行各业提供全新的解决方案,甚至会变更原来的业务流程和使用方式。人工智能已经成为国家的重点发展方向之一,各行各业也加入到AI这个大家庭。

2025-06-10 10:46:54 662

原创 为什么说Agent是一场持久战?Kimi技术大牛的深入分析

2025年被认为是"The Year of Agent",是大模型从Chatbot转向可执行动作的Agent的一年。

2025-06-09 20:47:35 653

原创 DeepDTAGen:用于药物-靶点亲和力预测和靶点感知药物生成的多任务深度学

今天介绍的是Nature Communications上的一篇名为“DeepDTAGen: a multitask deep learning framework for drug-target affinity prediction and target-aware drugs generation”的文章。在药物发现领域,寻找能够与特定靶点蛋白相互作用的新药物一直是一项充满挑战的任务。这一过程不仅需要大量的实验验证,而且成本高昂、耗时漫长。

2025-06-09 20:28:37 855

原创 DeepSeek来了,程序员焦虑?别慌,这本书直接给你破局方法论!

本书涵盖数电、体系结构、汇编语言、编译器、操作系统等计算机核心课程的基础内容,结合项目实践能够对整个计算机学科建立宏观的理解,并能完成制作一个基本计算机系统的任务。在加州大学伯克利分校获得计算机科学博士学位,目前为希伯来大学计算机科学与工程学院教授,以色列科学院及人文学院院士。研究方向为计算机科学、博弈论和经济学的交叉领域,如算法博弈论、经济与计算等。不闻不若闻之,闻之不若见之,见之不若知之,知之不若行之。学至于行之而止矣。—荀子(公元前313—公元前238)

2025-06-07 10:23:20 1002

原创 抓住未来!《人工智能真好玩》用趣味启蒙,让孩子轻松爱上AI世界。

这是一部专为中小学生打造的通识科普书。在人与AI日益交织的时代,本书帮助孩子们找准自己的定位,从容迎接未来挑战。在人工智能深刻改变我们生活的今天,人与AI的关系或许可以归结为四种角色:使用者、竞争者、制造者、监督者。本书从这四个核心视角出发,带领小读者全面认识人工智能的本质、应用与影响。?成为智慧使用者(第1章) 从智能家居到短视频推荐,帮助读者辨别生活中的真实AI应用,提升主动运用AI工具改善生活的意识与能力。?

2025-06-07 10:21:50 727

原创 全网最详细的大模型学习路线图:一篇文章搞定所有知识点!

在深度学习领域,"大模型"通常指的是模型参数数量庞大、拥有深层结构的神经网络。这些模型的规模通常表现为网络中的参数数量,即模型中需要学习的权重和偏置的数量。具体来说,大模型可能包含数百万到数十亿的参数。

2025-06-06 10:18:29 1012

原创 2025最新版大模型入门教程!喂饭教程,看这篇就够了!

大模型,英文名叫Large Model,大型模型。早期的时候,也叫Foundation Model,基础模型。大模型是一个简称。完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一类——语言大模型(Large Language Model,也叫大语言模型,简称LLM)。除了语言大模型之外,还有视觉大模型、多模态大模型等。现在,包括所有类别在内的大模型合集,被称为广义的大模型。

2025-06-06 10:08:17 980

原创 搭建个人知识库 | 手把手教你本地部署大模型(附教程)_个人部署大模型配置

今天给大家分享的是读完本文,你会学习到虽然我们大多数人不需要在自己部署大模型,但是我期望在本文的帮助下,能够带你手把手折腾一遍。这样在使用任何软件的时候,可以做到知其然,知其所以然。所有人都会手把手教你部署XX大模型,听起来很诱人,因为不需要科学上网,不需要高昂的ChatGPT会员费用。下面我通过一组数据来让大家有个感性的认知。以下文字来源于视频号博主:黄益贺,非作者实操最低配置:8G RAM + 4G VRAM建议配置:16G RAM + 8G VRAM。

2025-06-05 10:44:36 1167

原创 DeepSeek单条视频100万+播放:拆解可复制的爆款文案公式_头条爆款文案拆解提示词

前两天,我刚建的视频号,出了个小爆款。靠着DeepSeek的热点,0投放,完成了单条视频百万播放、近8万转发、直接带来1.6万粉丝增长。一个礼拜前,我刚刚下载了剪辑软件,还用不明白操作。春节几天,新号变黄V,惊喜完成起号。那为啥要写这个文章?不是我在得瑟,而是爆了之后,太多新朋友、老朋友来问我:你到底咋搞的?教教我?这,我实在没法一个个去回复,不如就专门做一篇拆解。再有人问我,就直接发文章给他吧~

2025-06-05 10:39:57 989

原创 从零开始学 Dify-扫描、加载和管理模型提供者的详细过程

Dify 项目实现了一套灵活、可扩展的大模型快速接入机制,通过分层设计和配置驱动的方式,使系统能够轻松集成各种 AI 模型提供商的服务。下面将从架构设计、核心组件、工作流程和扩展机制等方面进行详细分析。(代码版本v0.6.3,从1.0.0开始正式升级为插件机制)Dify 的大模型接入机制采用了三层架构设计,实现了模型提供者、模型类型和具体模型实例的解耦。接下来逐层进行分析。是 Dify 大模型快速接入机制的核心组件,负责扫描、加载和管理所有模型提供者。下面将详细介绍其工作原理和实现过程。

2025-06-04 11:05:16 675

原创 从零开始学 Dify-详细介绍 Dify 模型运行时的核心架构

Dify 模型运行时是 Dify 平台的核心组件,它提供了一个统一的抽象层,使得平台能够集成和管理各种 AI 模型提供者(如 OpenAI、Anthropic、本地模型等)。这种设计使得 Dify 能够以一致的方式与不同的模型交互,同时隐藏了底层实现的复杂性。

2025-06-04 10:47:05 685

原创 多模态大模型不会画辅助线?最新评估得分:o3仅25.8%,远低于人类82.3% | 清华腾讯斯坦福联合

多模态时代应如何评估模型的视觉输出能力?来自清华大学、腾讯混元、斯坦福大学、卡耐基梅隆大学等顶尖机构的研究团队联合发布了:一款针对大模型的视觉推理能力的新型基准测试。过去的评估基准主要集中于评估多模态输入和纯文本推理过程。而RBench-V系统性评估了当前主流大模型基于“画图”的视觉推理能力:比如在图中画出辅助线、描点连线、绘制光线路径、标注目标区域,等等。结果发现,即使是表现最好的模型o3,在RBench-V上的准确率也只有25.8%,远低于人类的82.3%。

2025-06-03 21:05:12 948

原创 梁文锋新论文发布,DeepSeek R2即将问世

01自DeepSeek出圈以来 ,梁文锋和DeepSeek的举动一直是行业关注的焦点。最近DeepSeek 团队发布最新DeepSeek-V3论文,有自媒体评价:实现了DeepSeek R2发布前的关键技术突破。4月份就有传言,DeepSeek R2会在5月正式发布,如今5月已经过去一半,DeepSeek R2仍犹抱琵琶半遮面。DeepSeek R1 是基于V3基座模型进行训练的,所以V3论文中涉及的参数,也大概率决定着R2的性能。这篇论文相当于R2大餐上桌前的小菜,充满噱头,一时挑起大家对 R2期待。

2025-05-30 10:15:00 893

原创 一文读懂大模型及其框架:核心知识与对比

不同的大模型框架各有其优势与劣势,选择合适的框架需要根据具体的应用场景、硬件配置以及开发需求来决定。Ollama适合快速实验与原型设计;vLLM则应对多并发有更好的性能。推荐使用VLLM,版本更新频繁,社区相对活跃,生态更为完善,推理速度满足需求,如果有多模态和其他需求,LocalAI更为合适。

2025-05-30 07:15:00 760

原创 AI大模型训练全攻略:超详细步骤与资源大放送!

大模型训练被分解成了预训练,监督调优,对齐等阶段。先看预训练,预训练,即Pre-training。预训练的目的是让模型学习语言的特性,主要是学习语言表达的流畅性和规则。至于具体的语言任务,比如对话,角色扮演,信息抽取,翻译,阅读理解,问答等,则需要放到监督调优。预训练是大模型的基础和核心,预训练阶段决定了模型的基础能力和上限。

2025-05-29 08:45:00 1814

原创 一文了解大模型应用基本概念,非常详细收藏我这一篇就够了

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索和文本生成的技术,主要用于提升大语言模型(LLM)在问答、对话和内容生成等任务中的准确性和可靠性。RAG 的核心思想是通过检索外部知识库或文档来增强生成模型的能力,从而生成更准确、更有依据的答案。给模型配个外挂,比如一个学生考试不会做题,但是旁边有个超级图书馆,每次做题前都翻一下图书馆里面的书,答案马上就精准了,RAG就是这么回事。

2025-05-29 07:15:00 887

原创 什么是推理大模型?推理大模型与普通大模型的区别是什么?

当下,“推理大模型” 成为一个备受瞩目的热门词汇。那么,推理大模型究竟是什么呢?它和我们熟知的普通大模型又有何区别?在实际应用中,我们又该如何选择呢?今天,就让我们一同深入浅出地揭开推理大模型的神秘面纱。我们先来认识一下推理大模型。简单来说,推理大模型是一种在海量数据基础上训练而成,具备强大逻辑推理能力的人工智能模型。它就像是一位 “逻辑高手”,能够对输入的信息进行深度的分析、推理和判断,从而得出具有逻辑性和合理性的结论。

2025-05-28 10:34:24 305

原创 2025年大模型Agent RL训练多轮planning技术

还有一些跟search相关的工作,比如R1-Searcher,ReSearch, Search-R1,DeepResearcher等,有兴趣可以看看。总体上,agents的训练拓展还是基于现有的rl基础设施,做了一些修改,谈不上是巨大的创新,但是这个领域逐渐活跃起来了,说不定大家卷来卷去发现了一条百试百灵的路径,让rl和agents更完美的融合,门槛进一步降低,支持更复杂的场景。

2025-05-28 10:21:25 1023

原创 一文读懂: AI 智能体 的 架构原则、3高架构、 存储架构 的核心方案

搞架构设计就像开车,新手只管踩油门,老司机得懂看路况预判风险。你说那些熔断、隔离、双活的设计,不就是给系统系安全带、装安全气囊吗?见过太多团队前期图省事,后期天天救火。就跟装修不舍得买好电线,住进去三天两头跳闸。所以说啊,架构师的眼光得比业务跑得快半步,既要扛得住今天的量,还要兜得住明天的险。这行当最迷人的地方就在这儿——你设计的每个决策,都在默默守护着千万用户的体验。当用户丝滑地用着AI功能时,哪知道后台经历过多少惊心动魄的战役?这份深藏功与名的成就感,不就是技术人最好的奖赏吗?

2025-05-27 11:36:11 1164

原创 我真的花了很久,才理清大模型到底该怎么学!

说句实在的,很多人以为学大模型就是搞点提示词、调个 API,就能搞定一切。但真想“弄懂它”,甚至“做出点东西”来,不啃几本靠谱的书,真的不行。直到我静下心认真啃完这些书,才发现——原来很多问题,书里早就帮你解答了。这几本书是小图一路上踩坑总结的「大模型学习黄金书单」,从编程入门,到深度学习基础,再到 LLM 原理、落地应用,完整一条线,不忽悠、不烧香,适合想认真搞事的朋友!别的不说,谁学 Python 没啃过“蟒蛇书”?Amazon、京东编程类榜首,影响 250 万读者,可不是吹的。

2025-05-24 10:29:35 619

原创 刚刚,Claude 4 重磅发布!免费可用,全球最强编程 AI!

虽然。

2025-05-23 11:23:09 1076

原创 FinMaster:首个模拟多步骤金融操作的大模型金融测评基准

金融任务对全球经济稳定至关重要,但面临劳动密集、低容错率、数据碎片化和技术工具局限等挑战。大型语言模型(LLMs)在自然语言处理上表现出色,但在金融领域的评估基准存在领域数据不足、任务设计简单和评估框架不完整的问题。本文提出FinMaster,一个全面的金融基准,系统评估LLMs在金融素养、会计、审计和咨询方面的能力。

2025-05-22 21:09:17 822

原创 人机交互型Agent方案Magentic-UI:兼看GraphRAG生成加速、无人机控制项目实现思路

我们来看看Agent的事情,看到一个思路,通过人工介入Agent运行控制思路Magentic-UI,这个有点像高级的RPA。但是,。中间这种形态,真实使用起来,其实并不友好,但是很适合做实验对比,所以看看起实现过程。另一个,就是关于GraphRAG以及无人机控制的项目,重点看实现思路。抓住,会有更多深度思考。大家一起加油。来看看Agent的进展,微软发布的。

2025-05-22 21:05:44 648

原创 华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

昨天的文章已经提到,昇腾超大规模MoE模型推理部署技术在本周会有持续的技术披露,果然第二天的技术报告又如期而至了。要问最近哪个模型最火,(MoE,Mixture of Experts)绝对是榜上提名的那一个。它的巧妙之处,就在于把不同的任务分配给擅长处理的,让整个系统性能得以提升。但你知道吗?正是这个关键的专家网络,也是严重影响系统推理性能的因素之一。因为在大量任务来临之际(尤其是超大规模时),MoE并不是以“雨露均沾”的方式去分配——专家网络们的,就会显得尤为突出。

2025-05-21 11:56:24 700

原创 快速爆火,一款开源免费的智能闲鱼客服机器人系统!

Xianyu AutoAgent 是一个基于Python的闲鱼自动化运营解决方案,通过逆向工程与智能自动化技术,实现了商品智能发布、自动擦亮、消息秒回等12项核心功能。项目开源3个月斩获2.2k Star,日均请求处理量突破50万次。

2025-05-21 11:42:53 755

原创 Agent 部署全解析:LangGraph团队实战洞察

智能 Agent 的商业化落地,不仅是算法和模型的竞技,更是基础设施与运维能力的考验。开发者应从业务需求出发,梳理最核心的部署与运行指标,构建一套“

2025-05-16 14:44:28 326

原创 “4.1 淘汰 4.5 !”OpenAI发布升级版GPT-4.1全家福:推理、编程性能升级

5月15日消息,OpenAI在美国当地时间15日凌晨宣布,正式向ChatGPT用户推出GPT-4.1、GPT-4.1 mini以及GPT-4.1 nano三款人工智能模型。OpenAI发言人表示,与GPT-4o相比,GPT-4.1在编程能力和指令执行上表现更优,且运行速度比其o系列推理模型更快。在多个关键评测中,OpenAI表示GPT-4.1展现出强劲性能:在SWE-bench Verified软件工程基准测试中,GPT-4.1得分55%,较GPT-4o的33%提升了22%。

2025-05-16 11:31:41 721

原创 全球首个AI设计Agent内测了,手慢就没资格了

最近圈子里被一个新词刷屏了:“AI设计代理”。一开始我也没在意,直到某位资深设计师朋友神秘兮兮发我一个链接,说:“别问了,这可能是你今年唯一值得抢的AI工具,赶紧去排队。我点进去一看——是。它自称“全球首个AI设计代理”,可以用一句话命令自动完成海报、LOGO、视频、甚至3D动画设计,彻底颠覆了我对“AI画图工具”的认知。。也就是说,它不是帮你“画个图”,而是直接接手一整个项目。你说出一句话,比如:“我要一个文艺风格的香氛品牌全套视觉。

2025-05-15 11:07:02 1588

原创 随着大模型技术的发展——RAG技术有可能会被淘汰吗?

关于RAG技术有很多不同的观点,有人认为RAG技术是大模型的阶段性解决方案,最终会被淘汰;但也有人认为RAG技术仍不能被替代,其作用依然无可代替;而还有观点认为RAG技术会随着大模型技术的迭代进行升级,更多的是会形成协同发展。而从企业的角度来说,由于RAG技术未来的不确定性,因此有些人对RAG还存在各种各样的顾虑问题。所以,我们今天就来讨论一下关于RAG在未来的发展形势。

2025-05-15 10:51:11 930

原创 从零开始,亲手开发你的第一个AI大模型!(一)基础知识

在刚刚结束的 Google Cloud Next ’25 大会上,谷歌发布了诸多重磅更新。如果你观看了整场发布会,你就会感受到 AI 代理(Agents)技术带来的巨大冲击。今年的关键词可以说是:**Agent、Agent、还是 Agent!

2025-05-14 10:40:18 1328

原创 如何借助分类路由让Qwen3实现思考模式自动切换?兼看DeepFlow等技术进展

技术总是在变化,也都是那么朴实无华,

2025-05-13 09:45:00 633

原创 关于大模型应用过程中的记忆功能管理问题,以及解决方案

大模型应用的很多功能包括记忆管理,需要的不仅仅只是技术问题,还需要足够的工程化能力才能解决。众所周知,大模型是没有记忆功能的,因此记忆管理就成为大模型应用过程中必不可少的一个环节;虽然说记忆管理说起来很简单,但在实际操作中还是存在很多问题。比如说,随着记忆的增加token成本的上升,大模型窗口的限制,记忆的存储问题等等。因此,今天就从项目的实际操作中来详细了解一下大模型的记忆功能;开发框架是基于langchain的记忆管理模块。大模型记忆管理问题。

2025-05-13 05:30:00 920

原创 OpenAI终于把自家六款模型的使用场景说清楚了。

OpenAI 有很多的模型版本,时常把人绕晕。我经常用 GPT 时,也会迷糊到底这个任务适合用哪个模型。好在最近 OpenAI 官方终于发布了一个详细的介绍。我翻译了下,并且做了一张表格。适合日常使用场景:如头脑风暴、总结、撰写邮件和创意内容等。具备全模态能力:支持几乎所有功能(GPTs、数据分析、搜索、图像生成、画布、高级语音等),并能处理多种输入类型(文档、图片、CSV 文件、音频和视频)。

2025-05-12 11:15:00 1035

原创 国内大模型人才大战打响!大厂各出奇招,薪资不设上限、CTO亲自参与指导、无需实习经验

眼花缭乱了。为争夺AI人才,大厂们齐齐放大招!各种天才、顶尖人才计划简直看不过来。每个都扒开粗略一看,满满都是……老天奶,都2025年了抢人咋还这么疯。而与抢人同步进行的是,他们还到处挖大牛,以大牛的明星效应来吸引大量业内顶级人才加盟——字节挖来谷歌DeepMind研究副总裁吴永辉、阿里招揽全球顶尖AI科学家许主洪。前几天,阿里薄列峰离职被曝加盟某大厂……好好好,激烈程度不亚于商战。难怪马斯克也曾经发出感慨:AI的人才争夺战是我见过最疯狂的。

2025-05-12 07:30:00 877

原创 LangChain脚本如何调度及提效?

概述LangChain[1]是开源领域最流行的大模型编程开发框架,支持通过python/js语言快速构建AI应用。Dify[2]是开源的图形化大模型应用开发平台,可以通过可视化的画布拖拖拽拽快速构建AI agent/工作流。通过任务调度系统托管AI任务,可以进行脚本版本管理、定时调度、提升资源利用率、限流控制、可运维、可观测。由于篇幅有限,本文章主要介绍通过任务调度SchedulerX[3]进行LangChain脚本的管理和调度,Dify工作流调度将在下一篇介绍。脚本管理及调度。

2025-05-10 11:30:00 976

原创 MCP实战高阶:借助LangChain快速打造MCP天气助手

最近,LangChain发布了一个新的开源项目langchain-mcp-adapters[1],该项目为开发者提供了一种便捷的方式,将MCP (Model Control Protocol) 服务器无缝集成到LangChain生态系统中。MCP是一种通信协议,允许大语言模型与外部工具和服务进行交互。而LangChain则是构建LLM应用的流行框架。的出现,极大地简化了两者之间的集成过程,让开发者可以更专注于业务逻辑的实现,而非底层通信细节。

2025-05-10 08:45:00 890

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除