- 博客(24)
- 收藏
- 关注
原创 一文读懂RAG、LangChain、Agent 到底有啥关系?
比如,在上面合规小组的例子中,如果我们问“公司是否符合第九条”,RAG 会从知识库中找出《ISO-27001》的第九条文本 + 公司制度文档中对应段落 + 相关案例记录,再一起喂给大模型生成结果。RAG、LangChain 和 Agent,并不是横向可替代的“技术工具”,而是纵向递进的能力结构:理解这些能力的分层与协作方式,才能搭出真正“能干活”的 LLM 系统。这些能力,是一个完整的信息检索、信息整合以及总结输出的过程,那么,一个 LLM 应用,怎样才能处理这种合规级别的任务?这几段文字要不要合并摘要?
2025-07-07 22:08:57
505
原创 stable diffusion原理解读通俗易懂,史诗级万字爆肝长文,喂到你嘴里
stable diffusion作为Stability-AI开源图像生成模型,其出现也是不逊于ChatGPT,其发展势头丝毫不差于midjourney,加上其众多插件的加持,其上线也是无线拔高,当然,手法上也稍微比midjourney复杂点。至于为什么开源,创始人:我这么做的原因是,我认为这是共同叙事(shared narrative)的一部分,有人需要公开展示发生了什么。再次强调,这应该默认就是开源的。
2025-07-07 21:31:36
564
原创 Vol 49. Vibe Coding 的坑到底有多少?
从一个SVG转PNG插件开发实例看AI编程的真实体验作者:MarkShawn·2025-07-06#Vibe Coding#Claude Code#AI编程#插件开发#开发实践#技术挑战#工程经验。
2025-07-07 21:25:35
485
1
原创 这可能是目前最全的《Claude code使用指南》
Claude Code 不是又一个 AI IDE,而是革命性的 CLI 智能编程助手!核心痛点Cursor 等 AI IDEAI 能力被阉割出于成本考虑,提示词工程降智,回答质量差原生 Claude 4 Sonnet/opus工具调用限制仅 25 次工具调用,复杂任务被强制中断无限工具调用上下文太短上下文窗口小,大项目理解不全200K+ 上下文Agent 能力弱长任务会被夹断,无法自主完成完全自主 Agent调试能力差只能看代码,看不到系统状态直接读取系统日志。
2025-07-07 21:15:23
1444
原创 华人00后PPT Agent夺得榜首!Notion也来卷AI会议纪要啦?|Product Hunt精选41
如何能更高效的发现线上销售线索?用户登录 LinkedIn 后,可以打开 Ciro 插件并输入目标用户的用户画像,之后 Ciro 就可以一键在 5 亿+档案中搜索相关用户并读取他们的个人信息页,分析出符合要求的线索并自动导入联系人列表,甚至能完善其个人信息,还支持同步到 CRM 或者下载 CSV。Tyce 适用于频繁处理文档的场景,如销售、法律和运营等行业,用户可直接上传、链接 Google Drive 或是新建文档,核心功能包括文档搜索、自动生成专业文档、智能填充表单和模板,以及实时 AI 编辑。
2025-07-07 21:08:05
317
原创 AI PPT修罗场,百度文库闷声拿下“全球第一”
可真正用过的都懂:生成是生成了,十有八九得“回炉再造”——格式“劈叉”、内容错乱、配图驴唇不对马嘴,说好的“智能”全成了“鸡肋”,最后还得自己吭哧吭哧当裁缝。他们以近乎偏执的务实精神,锚定用户痛点死磕,迎难而上千锤百炼,既能解顽疾,又能供活水,将每一个技术浪头精准转化为用户体验的实质跃升,最终让文库成为百度。工具常“金玉其外,败絮其中”,群众苦其“一本正经地胡说八道”久矣,尤其碰上金融数据、医学术语,错得能让人冷汗直飚、尴尬症犯,用户还得费心校对,如履薄冰。“铁军”的队伍,展现出超强的迭代嗅觉与执行力。
2025-07-07 21:06:16
258
原创 多模态大模型-BLIP
视觉 - 语言预训练(VLP)已推动许多视觉 - 语言任务的性能提升。然而,大多数现有预训练模型仅在基于理解的任务或基于生成的任务中表现出色。此外,性能提升在很大程度上依赖于从网络收集的含噪声图像 - 文本对来扩展数据集,而这类数据作为监督信号并非最优选择。本文提出 BLIP, 一种新型 VLP 框架,可灵活适配视觉 - 语言理解与生成任务。BLIP 通过引导字幕处理有效利用含噪声的网络数据:一方面利用字幕生成器创建合成字幕,另一方面通过过滤器剔除噪声字幕。
2025-07-07 21:02:36
557
原创 万字长文,深度解剖大语言模型(LLM)底层工作原理
DPO巧妙地证明,可以通过一个简单的分类损失函数直接在人类偏好数据上优化LLM,其效果等价于RLHF中的KL正则化策略梯度法,但完全绕过了训练奖励模型和进行强化学习的复杂步骤,大大简化了对齐过程。不过,整个手写过程中涉及到的技术,远远不止上图中所看到的,还涉及到很多其他的概念、机制、公式和技术,要想手写一个大模型,并不是简简单单的写一个Demo,而是一个系统性的工程,需要对机器学习、自然语言处理、RNN、Seq2Seq、Transformer、模型预训练、模型微调、模型部署等全面掌握、系统学习。
2025-07-07 20:58:46
490
原创 读这一篇就够了:万字长文介绍Agent的前世今生,从基础架构,核心模块,主流框架等方面解读智能代理器
原创 Fangyuan16Kaggle实战机器学习2025年07月07日 15:05北京用一句话介绍什么是智能代理?AI Agent(智能代理)是一种能够感知环境(Perceive)、做出决策(Planning)并采取行动(Acting)以实现特定目标的智能(LLM-Based)系统。与传统AI系统不同,Agent具有自主性,能够持续观察、思考、行动,并从结果中学习改进。核心特点核心特征描述自主性独立运行与决策,无需人类实时干预即可根据环境变化调整行为实现目标适应性。
2025-07-07 20:56:11
587
原创 学术分享丨院士领衔万字长文,全面系统梳理多模态LLM对齐算法
在多模态大型语言模型(MLLM)的研究中,对齐数据集是关键组成部分。由于多模态数据集的构建涉及到大量的数据来源、生成方法和注释技术,研究者们对不同构建方法进行了分类。这些数据集大致可以分为两类:引入外部知识的数据集和依赖自我标注的数据集。通过这些分类,研究者可以更清晰地了解不同数据集的特点,进而为多模态系统的优化提供支持。作者对现有MLLM对齐数据集进行了全面的分类与分析,详细介绍了不同构建方法的优缺点以及应用场景。
2025-07-07 20:51:58
866
原创 一图胜千言,图解 Transformer架构
为了演示目的,我这里的数据集仅包含三个英文句子,使用非常小的数据集来直观地执行数值计算。现实应用中,会使用更多更大的数据集来训练神经网络模型,例如我们所熟知的ChatGPT,用来训练他的数据达到 570 GB。我们的整个数据集仅包含三个句子这里由于数据集较小,因此数据清洗的工作量也是相对较小。而对于570GB的数据的清洗而言,将是非常麻烦的事情。在本文中,我演示了使用矩阵方法进行基本数学运算的方法。除了介绍了位置编码、softmax和前馈网络,最关键的是多头注意力。
2025-07-07 20:48:17
408
原创 多头注意力 VS 单头注意力计算成本区别多大?
矩阵的秩是指该矩阵中最大数量的线性无关行(或列)。一个矩阵的秩是它的行或列中,能够生成该矩阵的所有行或列的独立向量的最大数量。换句话说,矩阵的秩衡量了矩阵的“信息量”或“维度”,它反映了矩阵的行列空间的维度。
2025-07-05 17:37:32
779
原创 大语言模型的指令微调(Instruction Tuning)最全综述:从数据集到技术全解析
此前,我们已经介绍了大模型的三类微调技术(实际案例说明AI时代大语言模型三种微调技术的区别——Prompt-Tuning、Instruction-Tuning和Chain-of-Thought:https://www.datalearner.com/blog/1051681306547159)。但实际上,大模型的微调还可以分成很多种。从微调的参数规模来说,可以简单分为全参数微调和高效参数微调。前者一般是用预训练模型作为初始化权重,在特定数据集上继续训练,全部参数都更新的方法。
2025-07-05 17:35:01
621
原创 从零构建知识图谱:使用大语言模型处理复杂数据的11步实践指南
本项目使用CNN/DailyMail数据集作为研究对象。该数据集包含超过30万篇新闻文章及其对应的人工撰写摘要,是进行实体、关系和事件提取的理想资源。我们选择版本"3.0.0",这是该数据集的最新稳定版本。
2025-07-05 17:32:58
1066
原创 万字长文详解DeepSeek-R1模型工作原理
以往的研究通常依赖大量监督数据来提升模型性能。DeepSeek证明了即使不使用监督微调作为冷启动,通过大规模强化学习依然可以显著提升模型的推理能力。此外,适量冷启动数据的引入可以进一步提高性能。
2025-07-05 16:59:20
769
原创 美女机器人“小诺”惊艳亮相!面部表情高度拟真,松延动力这次玩真的?
听觉系统由8个高灵敏度麦克风组成的环形阵列构成,配合先进的声源定位算法,可以在5米范围内实现精准的语音拾取,即使在60分贝的环境噪音下,依然能保持95%以上的语音识别准确率。松延动力的快充技术,通过特殊的电池管理算法,可以在15分钟内完成80%的充电。这位拥有近乎真人表情的"女性"机器人,凭借其突破性的技术架构和近乎真人的交互体验,标志着我国在人形机器人领域的技术突破。小诺的发布是一款产品的成功,更是中国智能制造实力的体现,它标志着我国在人形机器人这一尖端领域已经具备了与国际领先企业同台竞技的能力。
2025-07-05 16:46:36
647
原创 这样做机器人必然失败
比如,看到一段文字,有的人只看到了字,有的人看到了它代表的意思,有的人看到了商机。有的能看到我们人类看不到的光(蝴蝶和蜜蜂能看到紫外线),有的只有很模糊的视觉,有的动物则只能看到近距离的东西。比如机器人如果理解不了自己身体的存在,可能就会经常摔跤,也可能做出来伤害自己的事情。生物的视觉都是生命闭环的一部分。扫地机、搬运机、跳舞机确实成功了,但它们都不是生命体,也不是真正的机器人,只是机器。大多数这类朋友对机器人的理解就是做一个看起来高科技的壳子加上舵机,对接大语言模型,能语音交互回答问题就是机器人。
2025-07-05 16:43:18
334
原创 魔法原子完成数亿元新融资:打通商业闭环,加速1000个场景落地
在推动人形机器人场景应用的过程中,魔法原子展现出开放的产业生态思维:既扎根实验室进行底层技术攻关掌握全栈自研技术,更积极投身于真实场景挖掘并满足场景需求,还通过与产业链上下游合作伙伴的深度联动,形成技术创新与产业应用的双向赋能,加速推动生产关系重构。快慢配合下,使得人形机器人既具备实时快速反应能力,又具备胜任复杂任务长序列能力,为人形机器人在真实场景应用中提供技术底座,也赋予了人形机器人在复杂场景中,理解和长序列任务自主规划等方面的能力。此外,魔法原子还与无锡市政府签署采购协议,并宣布达成战略合作。
2025-07-05 16:41:36
1021
原创 这样研发机器人才可能成功
如果把客服机器人、迎宾接待机器人、工业机器人、扫地机器人、搬运机器人、消防机器人也算成机器人的话,这个机器人的概念和机器人本原的概念已经不一样了。广义概念的机器人不是本文讨论的方向。最后,机器人要全面替代人能从事各项劳动,就得像人一样,拥有聪明的大脑,也需要灵巧的手脚以及健康的身体。比如我们先开发机器鱼,然后是机器鼠,然后是机器猫,然后是机器狗,然后是机器婴儿,然后是婴幼儿机器人,然后是保姆机器人。从字面上看机器人的内涵是“人”,而从现实看,机器人并非有血有肉的人,而是我们制造的用来替代人的机器。
2025-07-05 16:28:49
809
原创 中国首批脑科学家造机器人大脑,刚获数亿融资
目前,千诀科技已完成从基础框架构建到产品级落地的迭代,“具身大脑”已具备标准化能力,支持灵活适配和快速部署,兼容各类人形与非人形平台,在成本与工程交付效率上具有明显优势。在实际测试过程中,千诀科技具身大脑具有跨环境、无预设、长时程等特点,能够进行现场演示与落地应用,对比π0.5模型所搭建的家庭服务机器人场景更复杂,并可进行全开放现场演示。基于“类脑计算”的技术路径,“具身大脑”在构建决策大模型的同时,可以打通感知-推理-行为的系统闭环,形成机器人智能中枢,实现机器人从被动执行向主动规划的质变。
2025-07-05 16:17:34
781
原创 千觉机器人CEO马道林:机器人“双手”的进化路径
本次峰会由北京大学校友会主办,北京大学工学院、北京大学计算机学院、北京大学信息科学技术学院、北京大学科技开发部、北京大学创新创业学院、创客总部、创业公社支持,北京大学校友青年CEO俱乐部、北京大学校友会工学院分会、未名科创、“人工智能+”研习社联合承办,南方都市报、新智元、小饭桌等媒体支持,上海银行、灵心巧手、纯粹元素等赞助合作,汇聚400余位学术专家、产业领袖、校友企业家及投资人代表,展示北大先进制造与机器人及具身智能领域科研成果,共同探索机器人从“实验室”迈向“应用场”的关键路径,展望未来发展趋势。
2025-07-05 15:48:08
333
原创 人因直立行走,促进了大脑发展;如今机器人因大脑发展了,又要直立行走。我的观点:作为应用不建议人形,作为科研人形值得研究
当前主流依赖电机驱动(如谐波减速器),但扭矩密度(约50 N·m/kg)远低于人类肌肉(300 N·m/kg),而液压驱动(如波士顿动力Atlas)虽提升动力密度,却面临噪音与漏油风险。昨天被机器人马拉松现场刷屏了,北京机器人半程马拉松,各种机器人,有的离了歪斜的跑完,还有半路各种退出的,像极了人类的马拉松。对于机器人“人形”这个事,我一直是否定观点,机器人是“人形”这个事,在很多应用中没带来好处,难度倒是增加了很多。机器人也一样,有的强,有的弱,不论完赛与否,体育精神,重在参与,同样值得喝彩和鼓掌。
2025-07-05 15:40:25
889
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人