自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1047)
  • 收藏
  • 关注

原创 ChatDiet-基于大模型增强框架的AI营养师,提升个性化营养导向的食物推荐Chatbot

食物对健康的深远影响需要先进的以营养为导向的食物推荐服务。传统方法通常缺乏个性化、可解释性和互动性的关键要素。虽然大型语言模型(LLMs)带来了可解释性和解释性,但它们单独使用未能实现真正的个性化。本文介绍了ChatDiet,一个专为个性化营养导向食物推荐聊天机器人设计的新型LLM驱动框架。ChatDiet整合了个人模型和人群模型,辅以一个协调器,无缝检索和处理相关信息。个人模型利用因果发现和推理技术评估特定用户的个性化营养效果,而人群模型提供关于食物营养成分的概括信息。

2025-05-16 14:53:04 720

原创 终于,GPT-4.1全量上架ChatGPT:大家都看好我,偏偏我也争气

很好,今天一打开 ChatGPT 主页,发现 GPT-4.1 和 GPT-4.1-mini 上线了。很多人还记得,最开始,OpenAI 并没有打算让 GPT-4.1 和 GPT-4.1 mini 上线 ChatGPT,只是面向开发者推出了 API。因为这两个模型的定位,自诞生那一天就是**「OpenAI o3 和 OpenAI o4-mini 的替代方案」**,用来满足开发者更简单的日常编程需求。一般来说,GPT-4o 是可以解决大部分日常任务的,所以我们日常对话一般默认用这个模型。

2025-05-16 11:36:40 1077

原创 DeepSeek接入个人知识库,回答速度飞快,最新安装包即将发布!

本文介绍了本地知识库管理软件。

2025-05-15 11:28:14 791

原创 AI大模型年度发展趋势报告

中国工业互联网研究院全方位剖析大模型发展态势,从技术发展、生态建设、应用落地、商业模式等多维度深入研判,梳理出七大核心发展趋势。在文本能力上,随着模型参数、训练数据和训练时间的增加,模型文本能力的上限不断刷新。在多模态能力上,实时对话延迟显著缩短;图片理解、视频生成、图像生成的基准测试最高分不断被突破。在复杂思维能力上,模型后训练从单次采样转化为思维链强化和规模化采样,大模型应对代码、数学等高阶推理能力快速演进。模型处理容量上,大模型的上下文窗口不断扩大,上下文窗口中位数已达128k,闭源最大已达200万。

2025-05-15 11:24:01 1020

原创 Manus积分不够用!Coze太复杂!教你三步开发智能体Agent【Trae小白教程】

大家还记得前阵子很火的通用 AI Agent 工具当时邀请码都炒到天上去了,5万、10万的都有。**Agent服务,简单来说,它就像个超级能干的私人助理,**可以帮你一步步执行一些复杂的内容生成任务比如帮你写个长文、做个市场调研报告。然而,随着内测范围扩大,用户评价逐渐下滑。如今也终于开放了全面注册。,新老用户天都能至少免费体验一次。Manus火了之后,百度心响、Genspark、Fellou、Coze空间一个个都坐不住了。AI Agent,妥妥地成了各大公司眼里的下一个风口。

2025-05-14 11:01:30 1569

原创 腾讯云上线「AI开发套件」:5分钟搭建AI Agent小程序,支持MCP托管

DeepSeek-R1、混元 T1、混元Turbos……最近,很多开发者、企业技术团队都在忙着「接入大模型」。但接入只是起点,要真正打造一个能对话、懂业务、会操作的「Agent」,远比想象中复杂:选模型、写提示词、搭环境、打通数据、跑流程,怎么都得折腾好几天。要是想扩展一项新功能,还得自己写插件、搭服务器、跑运维,开发链路长、成本高、运维压力大。现在,这一切可以变得更简单。腾讯云正式发布「AI开发套件」—————

2025-05-14 10:56:44 703

原创 deepseek+即梦+Vidu做视频,真的王炸组合!AI还原古诗词《咏鹅》,保姆级别教程

自从做了立夏短片之后,这个王炸组合我就一直在复用了:deepseek+即梦+Vidu。文章分为五大部分:一、脚本创作(deepseek)二、画面制作(即梦AI)三、视频制作(Vidu)四、剪映剪辑,时长01:01让我看看是谁,还不会用deepseek(免费)写脚本和关键词?打开网站,输入:写一个《咏鹅》的视频脚本,原文是:鹅,鹅,鹅,曲项向天歌。白毛浮绿水,红掌拨清波。(记得勾选深度思考)一会儿给你安排一个脚本,接下来按照脚本出图,出视频就行了。

2025-05-13 10:30:00 742

原创 关于人工智能应用场景中前期数据处理的业务场景和技术分析——包括结构化数据和非结构化数据

文档处理是人工智能应用领域中的重要环节,其业务需求复杂,技术实现难度高;因此,怎么处理复杂文档是每个技术人员都需要考虑的问题。文档处理在当前人工智能行业下是一个非常基础也非常重要的工作,不论是模型的训练和微调,还是以RAG检索增强,亦或者是在传统的搜索引擎(包括百度,谷歌这种搜索引擎;以及电商等内部平台的搜索需求)中都是必不可少的一个重要环节。但面对复杂的文档格式和类型,文档处理的难度相当大;而且在不同的需求场景下,同样格式和内容的文档需要不同的处理方式;

2025-05-13 10:15:00 609

原创 vLLM单卡跑LoRA模型,CPU又爆了...

但是 tp>1 的时候,神奇的事情发生了,cpu 不会被打满,这个 warmup lora 的过程很快就完成了。一开始以为是这个过程会构建 cudagraph,tp=1 的时候,v1 引擎会错误的使用 cpu 去构图。而 tp>1 的时候会用 gpu 去构图,于是提了一个 issue 到 github 上,几个星期过去了,硬是从 0.8.3 版本熬到 0.8.5 都没有得到解决。

2025-05-12 09:15:00 952

原创 刚刚,ChatGPT的深度研究可以连接GitHub了!网友:这是真·RAG

ChatGPT在深夜又更新了一波大的——(Deep Research)功能,现在可以直接了!那么效果又是怎样的呢?例如我们在点击“深度研究”的同时,提出一个需求:我最近加入了团队,并接到一项任务要求熟悉我们的GitHub代码库。请提供一份简要报告,内容包括:项目目的与架构、关键模块、技术栈、值得关注的开源问题/合并请求,以及两项可执行的代码质量改进建议。在发送问题之后,输入框底部就会出现**“GitHub”**的选项;

2025-05-10 10:15:00 816

原创 25种RAG架构大揭秘:AI项目如何选型?

在当今的AI时代,你是否想过,如果AI能够每次都从全球知识中精准地提取完美答案,那会是怎样的体验?检索增强生成(Retrieval-Augmented Generation,简称RAG)正是实现这一目标的幕后英雄。从ChatGPT引用来源的能力到企业AI扫描数千份文件,RAG为语言模型提供了现实世界的根基。然而,RAG并非“一刀切”的解决方案。随着时间的推移,AI研究人员设计了多种专门的RAG架构,每种架构都针对不同的现实世界瓶颈进行了优化,比如幻觉、响应延迟、较差的现实根基或有限的上下文。

2025-05-10 09:00:00 957

原创 LLM4FTS:增强大语言模型用于金融时间序列预测,累积收益显著提高

预测金融时间序列面临低信噪比和复杂时间模式的挑战,传统机器学习模型能力有限。大型语言模型(LLMs)因其扩展的参数空间,展现出建模复杂时间序列依赖关系的潜力。现有LLM方法多集中于固定长度的分析,忽视了市场数据的多尺度特征。本研究提出了LLM4FTS框架,通过可学习的补丁分割和动态小波卷积模块增强LLM在时间序列建模中的能力。使用K-means++聚类和DTW距离识别市场数据中的尺度不变模式,进行自适应补丁分割以保持模式完整性。动态小波卷积模块模拟离散小波变换,灵活捕捉时频特征。

2025-05-10 08:30:00 1663

原创 HiRAG:基于层级知识索引和检索的高精度RAG

(如“DATA MINING”概括“BIG DATA”和“RECOMMENDATION SYSTEM”),摘要实体集合是所有聚类生成实体的并集。使用。

2025-05-09 11:27:03 641

原创 一文彻底搞懂智能体Agent基于ReAct的工具调用

AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。它结合了人工智能技术(如机器学习、自然语言处理、计算机视觉等),能够独立或协作完成目标。基于大语言模型(LLM)的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。支持Function Calling的模型(如gpt-4,qwen-plus等)能够检测何时需要调用函数,并输出调用函数的函数名和所需参数的JSON格式结构化数据。但并非所有的LLM模型都支持Function Calling(如d

2025-05-09 11:06:14 918

原创 Qwen2.5-VL的微调爬坑实录

最近在倒腾多模态相关的东西,主要是尝试用做一些(视觉定位)的任务。模型方面毋庸置疑选用的是目前最能打的系列,然而我在进行SFT实验的时候却绝望地发现:无论用多么高质量的数据集,或者多么花式地炼丹,最后得到的效果里bbox(bounding box)都会出现不同程度的漂移。我也是经过多番周折才解决了这个「大坑」问题。鉴于当时在github issue里留了微信之后有许多加好友前来咨询的朋友,因此觉得有必要写篇文章详细分享一下的「」之路。觉得过程太啰嗦的朋友可以直接。

2025-05-08 11:15:31 1191 2

原创 大白话解释Token:更多Token=更强AI?为何要用Token结算?

在自然语言处理(NLP)和大语言模型(如GPT系列)中,Token是文本的最小单位。你可以把Token看作是语言的“积木”或“像素”。就像搭积木一样,模型通过组合这些Token来构建句子、段落甚至整篇文章。举个例子:👉英文句子:“I love learning.” 可能被拆分为三个Token:“I”,“love”,“learning”。👉中文句子:“我喜欢学习。”可能被拆分为三个Token:“我”,“喜欢”,“学习”。

2025-05-08 11:14:21 938

原创 RAGFlow vs Dify, 商业化落地场景选哪个?

RAGFlow 与 Dify 代表了对话式 AI 的两种发展路径:前者在。

2025-05-08 11:13:12 1913

原创 大模型入门指南 - Inference:小白也能看懂的“模型推理”全解析

* 模型推理是训练好的大模型从“学习知识”到“实际应用”的核心环节。模型推理 = 让训练好的模型"干活"(比如回答你的问题、翻译文本、生成文章等)。**模型推理的本质是通过*为什么需要*Inference(模型推理)*?模型推理是AI的“最后一公里”——训练赋予知识,推理激活价值;若仅有训练,模型便如“空有蓝图”的图纸,永远无法落地为“解决问题”的生产力工具。********模型如同一个刚出生的“婴儿大脑”(随机初始化的参数),无法理解任何信息,也无法解决实际问题。

2025-05-06 11:23:55 1007

原创 Qwen3如何实现混合推理?

近期,阿里云发布的通义千问 Qwen3 系列模型以其混合推理能力引发了广泛关注,它能够在快思考与慢思考模式之间灵活切换,为不同任务提供精准且高效的解决方案,本文将深入探讨其背后的实现原理。Qwen3 引入动态门控机制来实时评估任务复杂度,其核心是对输入任务的多维度特征进行分析,如文本长度、关键词、语义复杂度等。

2025-05-06 11:22:36 1163

原创 Qwen3来了,全尺寸开源,性能拉满!附最新一手实测!

这两天技术群都在传阿里通义 Qwen3 五一前后发布,然后昨晚各种消息满天飞:一觉醒来,千问果然没有让人失望,赶在五一前发布并开源Qwen3,效率杠杠的。作为国内首个实现""能力的开源模型,Qwen3不仅达到了36万亿token的训练数据量,还支持119种语言和方言。通过混合专家(MoE)架构与混合推理机制的深度整合,在参数效率与任务适应性层面实现双重突破。旗舰模型Qwen3-235B-A22B在数学证明、代码生成等核心基准测试中,展现出与DeepSeek-R1、Grok-3等顶尖模型的竞争优势。

2025-04-30 17:25:05 1150 1

原创 Qwen3 发布,第一时间详解:性能、突破、训练方法、版本迭代...

从2023年4月,通义千问首次亮相,到2025年4月,Qwen3全面发布,短短两年,三代更新,阿里一步步把自己的大模型打磨到了世界顶级水准从最初的闭源探索,到如今 Dense、MoE 双线并进、思考模式无缝切换、超长文本系统优化……每个节点,都是硬仗这一路,真的不容易。

2025-04-30 17:20:59 1439

原创 手把手教你微调大模型:从数据清洗到训练部署全流程实战(附完整代码)

本教程使用🤗HuggingFace TRL框架来完成微调代码的实现。TRL是一个强大且便于使用的微调框架,除了支持SFT外,也能轻松的通过接口调用DPO、PPO、GRPO等流行的强化微调算法。此外也完美兼容Transformers架构。

2025-04-28 11:54:15 1122

原创 HealthGenie AI营养师:通过知识图谱和大模型为用户提供健康饮食指导 - 东京大学&MIT等

寻求饮食指导通常需要在理解复杂专业知识的同时,应考虑到个人的健康状况。知识图谱(KGs)提供了结构化且可解释的营养信息,而大型语言模型(LLMs)自然促进了对话式推荐信息的传递。本文介绍了HealthGenie,一个基于交互式系统AI营养师,它结合了LLMs和KGs的优势,提供个性化的饮食建议以及层次化的信息可视化,以便快速直观地概览。在接收到用户查询后,HealthGenie会进行查询细化,并从预先构建的KG中检索相关信息。系统随后会按照定义的分类可视化和高亮显示相关信息,并提供详细、可解释的推荐理由。

2025-04-28 11:43:57 730

原创 AI大模型ms-swift框架实战保姆级教程:Qwen2.5-7B高效微调实践指南

通过这一全面的大模型微调实战指南,结合 MS-Swift 框架的强大功能,您已手握开启模型潜能的钥匙。从目标明确的筹备,到精细入微的调整,再到严谨科学的验收,每一步都为模型在特定领域的卓越表现奠定基础。展望未来的应用开发征程,希望您能够持续不断地实践、探索与优化。凭借大模型强大的学习能力和泛化能力,结合MS - Swift框架提供的丰富工具和灵活接口,将其深度融入到各行各业的业务流程中。让大模型真正成为推动各行各业创新发展、实现智能化转型升级的强大引擎,为人类社会的进步与发展贡献智慧与力量。

2025-04-27 11:33:50 1082 1

原创 AI大模型ms-swift框架环境准备教程

通过以上对准备工作的详细介绍、基本概念的理解以及快速上手示例的实践,您应该对swift框架的开发入门有了初步的认识和掌握。这仅仅是一个开始,在后续的开发过程中,swift框架还有更多强大的高级功能等待您去探索,如更复杂的多模态训练、分布式训练等。同时,您可以将swift框架应用到更多的实际场景中,不断优化和扩展您的模型和应用,为解决实际问题提供更高效、更智能的解决方案。希望您在swift框架的开发之旅中,不断创新,取得丰硕的成果。

2025-04-27 11:19:46 1096

原创 DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此

新一代决策分析智能体SwiftAgent**。SwiftAgent是一款面向企业的数据分析与决策AI智能体,核心解决四层面问题:及时提供数据和事实,即需即给;给出深度洞察和智能归因;生成智能报告,指引业务决策;关联行动,自主进行长距离任务规划和执行。谭李还特别强调了企业级应用面临的挑战,为解决这些挑战,数势科技打造了完整的技术栈,解决企业级产品的数据安全、模型幻觉、计算性能问题。最后,谭李宣布了数势科技即将发布的智能分析Agent白皮书,作为行业方法论引领的重要一步。

2025-04-18 11:12:22 988

原创 大模型真的是下一个Token的预测器吗?

随着DeepSeek爆火,面试中也越来越高频出现,因此训练营也更新了DeepSeek系列技术的深入拆解。包括MLA、MTP、专家负载均衡、FP8混合精度训练,Dual-Pipe等关键技术,力求做到全网最硬核的解析~很久以前,牛顿发现了一个引力方程。这个方程非常简单(最多是高中代数水平),但它不仅能解释苹果为什么下落,还能预测行星及其卫星的椭圆运动。但它还是有一些小问题。最著名的是水星轨道与预测不符。爱因斯坦在提出广义相对论时解决了这些问题,这一理论还预测了黑洞和引力波的存在。

2025-04-18 11:03:16 596

原创 12种常见AI视觉大模型的应用赋能,全面梳理汇总!

DeepSeek-V3 是一款性能卓越的。

2025-04-17 11:53:08 833

原创 智谱开源 9B/32B 系列模型,上线 Z.ai

智谱将开源 32B/9B 系列 GLM 模型,涵盖基座、推理、沉思模型,均遵循 MIT 许可协议。该系列模型现已通过全新平台免费开放体验,并已同步上线智谱 MaaS 平台。其中,推理模型 GLM-Z1-32B-0414 性能媲美 DeepSeek-R1 等顶尖模型,实测推理速度可达 200 Tokens/秒(MaaS 平台),目前国内商业模型中速度最快。此外,其价格仅为 DeepSeek-R1 的 1/30。智谱启用全新域名。

2025-04-15 13:42:32 421

原创 时空预测登上Nature!2025必将持续爆火!

2024时空预测登上Nature子刊,火爆程度不容小觑。时空预测是指对未来某个时间点和某个地点的变量进行预测,涉及时间和空间两个维度的数据建模。本文为大家分享三种创新方案,为大家的研究提供idea.

2025-04-15 11:50:48 1348

原创 进击的大模型Agent! | Gartner预测:2028年,其将融入「三分之一的企业软件」

在当今数字化浪潮中,AI-Agent正迅速崛起,成为企业转型升级的关键力量。2025年,企业人工智能Agent开始崭露头角,其强大的自主分析与决策能力,正在重塑传统工作模式。本文将深入探讨AI-Agent的发展历程【6个阶段】、企业级应用、安全性以及未来趋势,揭示其如何助力企业迈向智能化新时代。。它们不仅可以完成单一工作任务,还可以理解上下文、制定计划,并独立执行整个业务流程。与前几年的人工定制化业务流程不同,如今的人工智能Agent能够驱动端到端的运营,这将是人类工作方式的一次革命性的转变。

2025-04-12 11:06:47 939

原创 #Token刺客来袭!AgentPrune一键屏蔽废话智能体,成本暴降60%性能翻盘

独木不成林,但“人多嘴杂”也未必是好事!随着基于大型语言模型(LLM)的多智能体系统逐渐成为解决复杂问题的主流方案,一个令人头疼的问题也随之而来:多智能体之间的通信冗余。想象一下,一个团队里每个人都想发言,但大部分内容其实毫无意义,不仅浪费时间,还增加了沟通成本。好消息是,这个问题终于有了解决方案!由同济大学、香港中文大学、北卡罗来纳大学等机构联合提出的 AgentPrune,首次通过**“多智能体剪枝”技术**,为多智能体系统量身打造了一种经济高效、简洁强大的通信框架。不仅能大幅降低通信开销,还能提升系统

2025-04-12 11:05:22 867

原创 Google | 发布第七代TPU,性能是最强超算的24倍+,提出A2A,构建Agent协作生态

AI 算力又迎来了新的标杆。昨天,谷歌正式发布了旗下第七代张量处理单元(TPU)。谷歌称,在大规模部署的情况下,这款 AI 加速器的计算能力能达到全球最快超级计算机的 24 倍以上。这款在 Google Cloud Next '25 大会上发布的新芯片代表着谷歌十年来 AI 芯片研发战略的重大转折:谷歌自研的前几代 TPU 主要面向 AI 的训练和推理工作负载,而 Ironwood 是第一款专为推理而设计的芯片。

2025-04-11 11:54:28 823

原创 StockAgent:基于LLM的多智能体股票交易框架

本文研究开发了名为StockAgent的多智能体AI系统,利用大型语言模型(LLMs)模拟投资者在真实股市中的交易行为。StockAgent评估外部因素(如宏观经济、政策变化、公司基本面和全球事件)对投资者交易的影响,分析交易行为和盈利效果。该系统避免了现有交易模拟系统中的测试集泄漏问题,确保模型不利用与测试数据相关的先前知识。实验结果显示关键外部因素对股市交易的影响,包括交易行为和股价波动规则。研究提供了基于LLM的投资建议和股票推荐的有价值见解。

2025-04-11 11:53:03 745

原创 利用大模型构造数据集,并微调大模型

目前大模型的微调方法有很多,而且大多可以在消费级显卡上进行,每个人都可以在自己的电脑上微调自己的大模型。但是在微调时我们时常面对一个问题,就是数据集问题。网络上有许多开源数据集,但是很多时候我们并不想用这些数据集微调模型,我们更希望使用某本书、某个作者的作品、我们自己的聊天记录、某个角色的对话来微调模型。用于微调的数据通常是成千上万的问答对,如果手工搜集,需要花费大量时间。文本将介绍一种方式,利用大模型来构造自己的数据集,并使用我们构造的数据集来微调大模型。

2025-04-10 11:03:54 984

原创 大模型微调教程:0 基础也能用云算力微调一个Ai甄嬛

微调相当于是可以使用自己的私有数据,私人定制一个专属大模型,比如法律领域、医疗领域、政务场景等。可以自定义模型回复的语气,个性和风格,你把大模型想象成一个小孩子,你想让他成为什么样,你就教他什么(训练语料数据集)。官话:微调LLM可定制其行为,增强领域知识,并针对特定任务优化性能。通过在特定数据集上微调预训练模型,旨在更有效地执行特定任务。实操部分。

2025-04-10 11:01:55 1028

原创 李宏毅2025 AI Agent新课来了!(附PPT)

编者按:本文是台大教授李宏毅讲授AI Agent的爆火油管视频的文字稿。内容层层递进,是学习和理解AI Agent难得的好教材。由于原视频较长,为方便订阅读者们高效学习,智能超参数特地整理出来这节课的文字实录。今天我们要讲的是AI agent,这是一个现在非常热门的话题。在课程开始之前,先讲一个免责声明,我知道你在各个地方可能都听过AI agent这个词汇,它是一个被广泛应用的词汇,每个人心里想的AI agent可能都不一样。我们要讲的AI agent是什么呢?

2025-04-09 11:23:44 1881

原创 AI 项目和团队怎么才能干出成果?从彭博社AI实战中得到的6点关键启示

彭博社的AI实践,给我们带来了一本宝贵的“实战手册”。

2025-04-09 11:17:21 351

原创 最新!Llama4突然发布!超越deepseek!开启超高性价比原生多模态AI和开源MoE的新时代,并公开训练策略!

Llama团队发布了。

2025-04-07 11:25:48 710

原创 甲子光年|43页权威《2025 AI Agent行业研究报告(二)》,AI Agent 落地正值元年,你一定不要错过!

2025年AI Agent行业研究报告(二)》由甲子光年智库发布,聚焦AI Agent的技术演进、产业应用与未来挑战。报告系统梳理了AI Agent从理论到实践的全景图,结合技术突破、商业案例与生态趋势,为中国AI Agent行业发展提供深度洞察。报告结合行业数据与头部厂商实践,揭示了AI Agent从“工具附庸”到“智能协作者”的范式革命,为中国企业智能化转型提供战略参考。

2025-04-07 10:42:08 1033

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除