- 博客(1277)
- 收藏
- 关注
原创 Google | 溯源分析RAG系统错误,提出选择性生成框架,让RAG问答准确率提升10%
当前RAG技术应用非常广泛,但是由于涉及技术节点比较多,问题排查通用非常困难。为此,本文作者对RAG系统出现的错误进行了深入的分析,**「引入充分上下文(Sufficient Context)的概念,指出RAG系统中的幻觉现象可能是由于上下文不足引起」**,为此提出了选择性生成框架来提高RAG系统的准确性,实验结果表明该方法可让RAG系统准确率最高提升10%。
2025-06-08 10:45:00
661
原创 性能大涨!阿里开源新版Qwen3模型,霸榜文本表征
今天凌晨,阿里巴巴开源了两款Qwen3系列新模型,Qwen3-Embedding和Qwen3-Reranker。
2025-06-07 19:28:43
577
原创 bge-base-en-v1.5微调实战!手把手教你打造垂直领域“最强大脑”,让Embedding模型秒变行业专家!
在构建RAG(检索增强生成,Retrieval-Augmented Generation)系统时,想要实现“问有所答、答之有理”,一份高质量的嵌入模型远比你想象的重要。
2025-06-07 19:27:57
616
原创 快手基础大模型团队7篇论文入选人工智能领域顶会ACL 2025
国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics,简称ACL)是由国际计算语言学协会(Association for Computational Linguistics)主办的学术盛会,每年举办一次。作为计算语言学和自然语言处理领域最具影响力的会议之一,第63届ACL即将于7月27日至8月1日在奥地利首都维也纳隆重举办。近日,ACL正式公布了论文录用名单,快手基础大模型团队凭借其在人工智能领域的深厚积累,成功入
2025-06-06 19:26:25
448
原创 字节跳动&清华大学开源多模态时序大模型ChatTS,可实现时序数据对话与推理
近年来,多模态大语言模型(MLLM)发展迅速,并在图像、视频、音频等领域取得了突破性成果。然而,相较于这些研究较为成熟的模态,时间序列这一类型的数据与大模型结合的系统研究却较为匮乏。
2025-06-06 19:25:18
772
原创 Response指南:为什么90%的多模态RAG,一做就会,一用就废?
近年来,GPT-4V、Gemini Pro Vision 等多模态大模型快速兴起,将图像、文本、音频等多种数据类型统一理解的能力,拓展到了搜索问答、辅助诊疗、法律检索等更复杂的任务场景中。
2025-06-06 19:23:40
705
原创 重磅开源!首个全异步强化学习训练系统来了,SOTA推理大模型RL训练提速2.77倍
作为 AReaL 里程碑版本 AReaL-boba 的重磅升级,AReaL-boba² (正式全名:A-ReaL-double-boba) 坚持 boba 系列 “**全面开源、极速训练、深度可定制**” 的开发理念,再次加量:除了更全的功能和更详细的文档说明,更以全异步 RL 为核心,发布 SOTA 代码模型,全面奔向 Agentic RL:
2025-06-05 19:40:47
797
原创 基于 Flink+Paimon+Hologres 搭建淘天集团湖仓一体数据链路
当前的淘天实时架构是从日志服务器和业务数据库采集数据,实时数据采集到 TT (消息队列中间件,对标 Kafka)中,离线数据采集到盘古存储中;在公共层会启一个流批任务做流批计算,实时运行流任务,定时调度批任务;在计算层,实时和离线数据会写到 Hologres(OLAP 组件)中,服务层的数据产品会基于 Hologres 表做数据产品的搭建和数据看板的展示。可以看到,数据直接从 DWD 层写到 ADS 层,没有实时的DWS层,因为TT 不支持去重,Kafka 同样如此。我们希望有一个流批一体的统一存储组件,能
2025-06-05 19:39:45
663
原创 港大&NV&MIT开源Fast-dLLM:无需重新训练模型,直接提升扩散语言模型的推理效率
最近的Gemini Diffusion语言模型展现了惊人的throughput和效果,但是开源的扩散语言模型由于缺少kv cache以及在并行解码的时候性能严重下降等问题速度严重受影响。
2025-06-05 19:11:40
949
原创 LoRI: LoRA 中到底存在多少参数冗余?
聚焦**:**多任务场景中,****Lora不完美,任然存在比较大的开销和无效参数的问题,****提出了LoRI方法****:****将投影矩阵****A** **冻结为随机投影,并使用特定任务掩码对矩阵****B** **进行稀疏化处理。这种设计在保持强大任务性能的同时,*****\*大幅减少了可训练参数的数量。
2025-06-05 19:10:36
735
原创 真心强大!Spring AI + MCP 智能体工具动态更新
模型上下文协议(Model Context Protocol,MCP)是 Spring AI 中的一个强大功能,它使 AI 模型能够通过标准化接口访问外部工具和资源。MCP 的一个有趣特性是它能够在运行时动态更新可用工具。
2025-06-04 20:34:55
797
原创 多模态模型在RagFlow中的应用
在RagFlow的最新版本中(0.19.0)中,为了提升对文档中各类图片的解析效果,也尝试引入了多模态模型(image2text)对图片内容进行增强解析。我们来详细分析一下相关的过程。
2025-06-04 20:32:36
963
原创 一口气讲清楚:AGI、RAG、AIGC
看了很多关于AI大模型的文章,发现其中高频出现了一些专业名词,比如AGI、RAG、AIGC等。看着很高大上,但这些名词到底是什么意思,又预示着什么,普通人很难通俗易懂的理解。
2025-06-03 20:40:14
995
原创 AI Agent智能体产品的5个级别
OpenAI发布了其根据自身技术研发与产品开发的通往AGI的五级量表。OpenAI 将 AI 开发分为五个阶段,每个阶段代表更高级的能力水平:
2025-06-03 20:38:45
630
原创 LangChain基于RAG实现文档问答
大语言模型所实现的最强大应用之一是复杂的问答(Q&A)聊天机器人。这些应用能够回答关于特定源信息的问题。这些应用使用一种称为检索增强生成(RAG)的技术。
2025-06-03 20:34:46
960
原创 论文浅尝 | HOLMES:面向大语言模型多跳问答的超关系知识图谱方法(ACL2024)
多跳问答(Multi-Hop Question Answering, MHQA)技术近年来在自然语言处理领域引起了广泛关注,尤其是在大规模语言模型(LLMs)用于问答任务的背景下。然而,面对复杂的多跳问题时,现有的LLMs表现不尽如人意,其主要原因在于:理解复杂问题所需的信息筛选和上下文聚合存在很大的挑战。为了缓解这一问题,研究人员尝试结合结构化知识图谱(KG)来简化信息,但这仍不足以应对复杂、多跳问题的挑战,因为这些方法通常缺乏上下文依赖性和对查询的具体化。因此,本文提出了一种超关系(Hyper-Rela
2025-06-02 10:45:00
868
原创 用Milvus构建RAG系统,N8N VS dify 如何选?
如果将大模型视为一个知识丰富但记忆有限的专家,RAG系统则是为其配备了一个能够实时检索和提供准确信息的辅助工具。
2025-06-01 10:45:00
991
原创 AI医疗企业盘点:谁在领跑AI辅助诊断赛道?
随着医学影像、电子病历等数据的爆发式增长,AI 通过深度学习算法(如卷积神经网络)对海量数据进行训练,逐步具备分析 CT、MRI 影像中的病灶特征、识别病理切片细胞异常等能力。在实际应用中,AI 系统可快速处理患者数据,生成初步诊断建议或风险预警,为医生提供决策参考,尤其在肺结节筛查、糖尿病视网膜病变检测等细分领域已实现商业化落地。这一技术不仅缓解了优质医疗资源短缺的压力,提升基层医院诊断效率,还通过持续学习优化算法,推动诊断标准的规范化。今天,小医来为大家深度解析该业务场景,介绍该领域表现卓越的公司,涵盖
2025-05-31 10:45:00
976
原创 本地豆包私有化RAG知识库构建案例
表友问:看到全网都在热议自己构建个人知识库,自己也想尝试,但本身对电脑也不是太熟悉,对这些各种应用与配置又不懂。虽然网上也有很多手把教的教程与指南,整个安装配置仍是麻烦。有没有一款针对电脑小白简单一点,打开就能即用的AI知识库?
2025-05-30 20:30:40
796
原创 动态数据太折磨人!静态RAG搞不定,就试下ZEP,让Agent调用实时知识图谱
您是否遇到过这样的困扰:**明明搭建了完善的RAG系统,但Agent总是回答过时的信息,或者面对历史偏好变化时一脸茫然?**
2025-05-29 19:40:33
889
原创 Dify工作流:用爬虫批量把公众号文章存到AI知识库 | 保姆级教程
我发现,很少人在用知识库,大家的一个痛点就是把内容加进「知识库」这件事比较费劲。
2025-05-29 19:14:30
1313
原创 多模态融合可能是现在或者未来一段时间最好发论文的方向了!
多模态融合**,一个2025年仍然处于爆发期的热门方向,还在持续吸引学术界与工业界的投入。作为顶会顶刊常客,它也依然是**当前最好发论文的方向之一**。
2025-05-29 19:12:21
1046
原创 总结!2025年大模型Agent RL训练多轮planning技术
DeepSeek R1带火基于GRPO的强化学习技术后,agentic tool use learning也开始用上了GRPO,Reinforce++, PPO, policy gradient等各种算法了(以前是SFT+DPO,需要大量的标注数据来cover bad case,当时标注高质量数据都把我标哭了),想让大模型学会使用code interpreter, web search等工具来增强现有模型的数学和推理能力, 单轮就是调用一次tool,多轮就是调用多次tools, 多轮tool use更难一点
2025-05-29 19:10:32
655
原创 用ollama在PC一键私有化部署qwen3
阿里最新开源的Qwen3,能力打平OpenAI-O1和谷歌Gemini2.5、超越DeepSeek,甚至多个领域超越成为第一。
2025-05-28 19:07:41
859
原创 Qwen3本地部署及核心对比介绍
Qwen3 延续了前代模型的“超大参数量”路线,据官方披露,其基础版本已达到 **万亿级参数规模** ,并采用混合专家(MoE)架构,在保证强大表达能力的同时控制计算成本。相比 GPT-4 的推测参数量(约1万亿),Qwen3 在训练数据和模型结构上进行了优化,推理效率提升明显。
2025-05-28 19:06:45
673
原创 大模型量化的认知三重境界
在大模型技术落地的实践中,量化作为重要的工程化手段,不同角色的技术人员需要建立差异化的认知体系。我认为"量化三重境界"可以帮助从业者构建符合自身职业定位的技术认知框架。
2025-05-28 19:05:35
935
原创 DeepSeek+RAGFlow的企业级知识库搭建指南
本实践指南旨在利用Ollama、DeepSeek、Docker 和 RAGFlow 在本地搭建一个私有知识问答库,通过结合强大的语言模型、高效的语义理解和灵活的检索增强生成技术,实现安全、可靠的企业级私有知识库系统
2025-05-27 21:21:51
660
原创 MCP实战高阶:借助LangChain快速打造MCP天气助手
最近,LangChain发布了一个新的开源项目langchain-mcp-adapters[1],该项目为开发者提供了一种便捷的方式,将MCP (Model Control Protocol) 服务器无缝集成到LangChain生态系统中。
2025-05-27 21:20:13
648
原创 谷歌发布MedGemma,基于Gemma 3构建,专攻医学文本与图像理解
HyperAI超神经官网的「教程」板块现已上线了「一键部署 MedGemma-27b-text-it 医学推理大模型」,快来体验 AI 医生问诊吧!
2025-05-27 21:18:19
964
原创 企业级Data Agent商业化落地的冷思考,相当全面!
今下午看了火山引擎Data Agent相关的直播,觉得受益匪浅,特别是第一个项目负责人海书山的发言,适合多次回味,大厂的同志对智能体的认知,就是有深度,不得不服。完整直播回放请直接火山引擎视频号观看。
2025-05-26 19:25:30
968
原创 字节发布视觉-语言多模态大模型,AI理解现实世界的能力越来越强了
字节发布的Seed1.5-VL还是挺强的。**定位是视觉-语言多模态大模型**,不只是能理解视觉、视频内容,还能处理一些复杂的相关问题。
2025-05-26 18:57:53
694
原创 大模型全面爆发,所有榜一都是Gemini!谷歌一夜站到了台前
北京时间今天凌晨 1 点,今年的 Google I/O 2025 开发者大会正式开启。谷歌最近的大模型技术风头正劲,今年的这场「科技春晚」吸引了全球关注的目光。
2025-05-26 18:56:11
951
原创 我用unsloth将Qwen3大模型微调成了一个脑筋急转弯专家
今天的Unsloth更适合在硬件资源有限的场景下做微调,它比LLama-Factory更节省GPU显存。
2025-05-25 10:45:00
944
原创 从Qwen3 MoE & 稠密模型性能测试-看CPU/GPU算力需求
自从通义千问推出Qwen3系列大模型,人们的注意力一下子从DeepSeek上转移出不少。有一点遗憾是235B的参数量,不见得能达到或者超过671B的效果?
2025-05-24 10:17:16
958
原创 TimeCMA: 通过跨模态对齐实现大语言模型驱动的多变量时间序列预测
本推文详细介绍一篇来自南洋理工大学S-Lab等机构联合发表在AAAI 2025上的文章《TimeCMA: Towards LLM-Empowered Multivariate Time Series Forecasting via Cross-Modality Alignment》,论文的共同第一作者是Chenxi Liu和Qiangxiong Xu。该工作旨在解决多变量时间序列预测中信息表征弱、模型泛化差、计算开销大的关键难题。作者创新性地提出了TimeCMA框架,通过引入大语言模型与时间序列之间的跨模态
2025-05-24 10:15:45
712
原创 每位AI工程师都应了解的A2A、MCP与ACP协议
MCP[1](Model Context Protocol,模型上下文协议)是由Anthropic公司提出的一种标准化接口,用于向大型语言模型(LLMs)提供结构化的实时上下文信息。
2025-05-24 09:49:43
736
原创 RAG不好用?试试MCP这个“知识库优化大师”
在企业数字化转型浪潮中,如何有效管理和利用内部知识资产已成为关键挑战。随着大型语言模型(LLM)技术的成熟,检索增强生成(RAG)应用正逐渐成为连接企业知识与AI能力的重要桥梁。然而,传统RAG实现常面临检索质量不佳、实时更新困难等痛点问题。
2025-05-24 09:48:52
975
原创 多快好省,Qwen3混合部署模式引爆MCP
**MCP的关键两步:**模型如何智能选择工具**和**工具执行与结果反馈机制。在选择工具时,模型是通过 prompt 来确定当前有哪些工具。我们通过将工具的具体使用描述以文本的形式传递给模型,供模型了解有哪些工具以及结合实时情况进行选择,这一步会消耗大量token,所以我们选择了本地部署的小尺寸的Qwen3-0.6b,不仅节约了token,还加速了工具选择。
2025-05-23 21:51:06
904
原创 DeepSeek + Dify 企业级大模型私有化部署指南
大模型私有化部署成本高?数据安全难保障?本文手把手教你用DeepSeek+Dify构建企业级专属AI平台,实测单卡可跑7B模型,三步实现数据绝对安全!
2025-05-23 21:46:59
719
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人