- 博客(2301)
- 收藏
- 关注
原创 无需网络,轻松在手机上离线布署本地大模型
一旦模型加载完成,进入“聊天”页面并开始与加载的模型对话!生成性能指标也会显示。如果感兴趣,可以通过观察聊天气泡查看实时性能指标:每秒令牌数和每个令牌的毫秒数。AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源。
2024-11-16 11:30:00
9785
1
原创 大模型LLM | 一文彻底搞懂大模型Agent(智能体):Agent、Agent + RAG
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!
2024-10-16 19:58:47
53830
1
原创 大模型 | 一文彻底搞懂预训练和微调(Pre-training vs Fine-tuning)
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!
2024-08-19 09:46:08
19950
原创 【编程新趋势】AI Agent时代已来临!零基础小白也能开发智能应用,大模型技术不再神秘!
AI Agent代表AI发展的第三阶段,能自主执行复杂工作流。其核心特征包括利用LLM进行决策、调用外部工具、主动纠正错误。适合处理复杂决策、难以维护规则和非结构化数据场景。架构包含模型、工具和指令三要素,正从单智能体向多智能体协作演进。开发中需关注可靠性、可观测性、并行处理和可测试性等工程挑战。2026年或迎来AI Agent普及期。
2026-01-06 14:34:33
745
原创 用友重磅发布BIP“本体智能体”(Ontology-Driven Agent),引领企业AI迈向自主决策时代!
当大模型从技术突破走向商业应用,企业已跨越“有无”的边界,却困于“真伪”的抉择。如何让大模型真正读懂企业特有的运营逻辑,以可信、可控的方式支撑关键决策,成为所有企业亟需攻克的核心议题。
2026-01-06 14:32:05
609
原创 程序员别卷了!AI Agent才是真·外挂,57%团队已投产,小白也能轻松驾驭大模型开发
2026年调研显示,57%企业已在生产环境部署AI Agent,大型企业领先。质量仍是最大障碍(32%),89%组织实施可观测性。多模型并用成常态,OpenAI GPT领先但非唯一。客户服务(26.5%)和数据分析(24.4%)是主要用例。编码Agent如GitHub Copilot已成为开发者日常工具。微调未广泛采用,多数团队依赖提示工程和RAG。
2026-01-06 14:30:50
144
原创 震惊!大模型开发者的‘生死劫‘:智能体工程,让AI应用不再‘翻车‘!
智能体工程是将非确定性的大语言模型系统转化为可靠生产体验的迭代过程,遵循"构建、测试、发布、观察、改进、重复"的循环。它结合产品思维、工程开发和数据科学三大技能,应对LLM能力跨越阈值但不可预测性高的挑战。与传统软件开发不同,智能体工程将生产环境视为最佳学习场所,通过快速迭代和持续优化,让AI应用真正落地并稳定运行。
2026-01-06 14:30:13
453
原创 AI智能体编排“神操作“:小白程序员也能让大模型变聪明,代码示例超详细!
文章深入探讨AI智能体的编排策略,详述六种智能体类型及适用场景,分析三种工具选择方法和四种执行拓扑结构。强调上下文工程确保有效执行的核心作用,提供设计智能体系统的最佳实践,帮助开发者构建高效可靠处理现实世界多步骤任务的智能体系统。
2026-01-06 14:29:14
481
原创 AI Agent编程革命:国家战略背书,2025年最火爆开发方向,小白也能快速上手!
AI Agent作为国家战略级赛道,正从"被动响应"向"主动闭环"质变,成为"新质生产力"核心引擎。文章解析了7大应用赛道:对话式智能分析、智能办公、营销、陪伴式硬件、数字人、开发管理平台及对话式AI,并给出企业布局三大原则:场景适配优先、技术架构可靠、落地能力为王。到2030年,Agent渗透率将突破90%,是企业数字化转型的"必修课"。
2026-01-06 14:27:35
362
原创 【爆肝实测】阿里AgentScope 1.0让大模型智能体开发“原地起飞“!小白秒变AI大神!
AgentScope 1.0是阿里巴巴开源的智能体应用构建框架,通过模块化设计与ReAct范式,解决了LLM智能体开发的四大痛点:API调用复杂、任务执行难以中断、多智能体协作混乱、行为难以调试。其四大基础模块(消息、模型、记忆、工具)高度解耦,内置多种智能体,并提供完整工具链,覆盖开发、调试、部署全流程,让开发者能像搭积木一样快速构建灵活、高效、可控的智能体应用。
2026-01-06 14:26:33
593
原创 大模型开发“躺平“不了?智能体工程硬核指南,让AI Agent从Demo到生产稳如老狗
文章介绍智能体工程(Agent Engineering)这一新兴领域,解决AI智能体从Demo到生产的工程鸿沟。系统阐述10大核心维度:交互工程、模型工程、推理与执行核心、上下文工程、记忆工程、知识工程、集成工程、可观测性工程、安全工程和治理工程。强调工程化对构建可靠生产级AI系统的重要性,指出AI开发者需从"写提示词"升级到"做生产级Agent系统"。
2026-01-06 14:24:49
598
原创 AI大模型实战——探索智能体世界:LangChain与RAG检索增强生成
起初,LangChain 只是一个技术框架,使用这个框架可以快速开发 AI 应用程序。这可能是软件开发工程师最容易和 AI 接触的一个点,因为我们不需要储备太多算法层面的知识,只需要知道如何和模型进行交互,也就是熟练掌握模型暴露的 API 接口和参数,就可以利用 LangChain 进行应用开发了。LangChain 发展到今天,已经不再是一个纯粹的 AI 应用开发框架,而是成为了一个 AI 应用程序开发平台,它包含 4 大组件。LangChain:大模型应用开发框架。LangSmith。
2026-01-06 14:23:43
309
原创 震惊!腾讯复旦联手推出Youtu-Agent:AI智能体开发从“手工业“迈入“自动化时代“,小白也能秒变AI大牛!
Youtu-Agent是腾讯优图实验室、复旦大学和厦门大学联合开发的智能体规模化框架,通过"分层YAML配置+双模式自动生成+免训练经验累积+分布式RL"四大创新,解决了智能体开发手工配置成本高和部署后能力僵化的痛点。其核心创新包括Training-free GRPO算法实现零梯度更新,三层解耦架构设计,工具合成成功率81.25%,使智能体构建从"手工业"升级为"自动化生产线",支持部署后持续进化,将开发周期从"周"缩短到"小时"。
2026-01-06 14:23:01
596
原创 【AI炸场】2025年大模型年度总结!DeepSeek-R1、Qwen3、Z-Image,小白也能起飞!✈️
文章回顾2025年发布的大模型,按类型分类介绍了LLM、VLM、文生图、视频生成、TTS、OCR等多个领域的重要模型。DeepSeek-R1开源对AI认知产生重大影响,TTS领域发展迅速,PaddleOCR-VL表现优异。展望2026年,多模态、TTS、OCR和图片处理可能成为发展重点。
2026-01-05 15:14:41
728
原创 【程序员必看】大模型中文回答更“懂你“?真相让人惊掉下巴!原来我们一直在自我脑补!
文章揭示了为什么大模型在中文回答时显得更"聪明"。核心观点是:中文"留白"让用户自己脑补另一半内容,产生"它懂我"的错觉;中文环境评价标准更宽容,不需要完全展开;在编程等需要精确推理的领域,中文并无优势;我们用"命中感"衡量模型能力,而非真正的推理能力。理解这一点有助于正确评估和使用大模型。
2026-01-05 15:13:46
475
原创 震惊!AI竟有“双重人格“?Gemini坚持2024年是真实世界的惊天秘密,程序员必看!
AI模型存在"双重人格":图书管理员(参数化记忆)和思考者(上下文处理)。Gemini坚持2024年是真实世界的问题源于其知识库在训练完成后不再更新,导致基于过时知识做出错误判断。随着上下文长度增加,问题可能加剧。理解这一机制对AI开发和使用至关重要,有助于规避AI模型中的潜在缺陷。
2026-01-05 15:11:39
816
原创 震惊!大模型让代码自动写?2026年AI编程技术大揭秘,小白也能秒变大神!
本报告全面复盘大模型技术发展历程,分析其在编程开发领域的创新应用,并展望未来趋势。报告指出大模型正深刻改变编程范式,提高开发效率,降低技术门槛。同时,大模型与各行业融合加速,创造新商业模式。建议关注技术领先、应用落地能力强的企业,把握AI编程时代的投资机遇。
2026-01-05 15:10:49
507
原创 百万token轻松处理!MIT递归语言模型RLM破解大模型“记忆障碍“,编程小白也能学会!
MIT研究团队提出RLM(递归语言模型)解决大模型"上下文腐烂"问题。RLM借鉴外存算法思想,将超长Prompt作为外部环境而非直接输入,模型通过生成操作指令按需调取内容处理。该技术包含外部化上下文、符号化交互、迭代执行与反馈三大步骤,支持递归调用子模型处理复杂任务。实验证明RLM能有效突破物理上下文限制,在长文本处理任务上表现优异,尤其在传统方法难以处理的复杂任务中优势明显。
2026-01-05 15:10:04
555
原创 “震惊!2025大模型技术大爆发:RLVR+GRPO引领推理革命,小白程序员也能秒变AI大神!“
2025年AI领域迎来RLVR与GRPO技术革命,推理模型表现超预期。文章详解了推理侧缩放、工具调用等关键技术,探讨了AI对编程、写作和科研的影响,指出私有数据是企业的核心竞争力。预测2026年将看到RLVR扩展应用、推理侧缩放普及以及持续学习技术突破,强调LLM进步依赖多维度技术协同发展。
2026-01-05 15:09:28
662
原创 大模型开发者的春天来了!智谱VS MiniMax港股双雄争霸:B端开源VS C端爆款,小白程序员该站队哪边?
文章对比中国AI独角兽智谱AI和MiniMax的上市与商业化策略。智谱采用B端开源+API路径,服务8000+机构客户,收入稳定;MiniMax押注C端多模态产品,收入增速快但波动大。两者均处亏损阶段,MiniMax面临知识产权诉讼风险。两家均获头部资本支持,但投资逻辑不同:智谱适合看好B端生态的长期投资者,MiniMax适合看好C端商业化的风险承受型投资者。
2026-01-05 15:08:47
712
原创 【AI革命】告别Token内卷!字节DLCM技术让大模型“智商“提升34%,计算量反而减少,小白程序员必看!
字节跳动Seed团队推出DLCM技术,将大模型推理单位从Token提升到Concept层级,通过动态分割Token序列为概念,在压缩空间中进行深度推理,再将结果重构为Token级预测。实验显示,该方法在推理阶段FLOPs降低34%的同时,平均准确率提升2.69%。DLCM实现了计算资源自适应分配,大幅提升大模型推理效率。
2026-01-05 15:08:12
1117
原创 AI大模型狂飙时代:Sora、World Model如何重塑编程与开发?【深度解析】
文章介绍了大模型、世界模型和Sora的概念及其应用。大模型具有强大表示能力和泛化能力;世界模型使AI能像人类一样理解预测环境;Sora作为OpenAI的文生视频模型,被视为"世界模拟器"。这些技术对自动驾驶意义重大,世界模型有望提升自动驾驶的感知预测能力,可能成为自动驾驶及具身智能领域的基础模型,推动行业格局变革。
2026-01-05 15:07:28
658
原创 大模型应用开发学习路线,一文打通前后端转AI之路,内附大厂面试秘籍!
文章提供AI大模型应用开发完整学习路线,强调Post-training和AI-Agent是当前工业界最缺人且性价比高的方向。学习内容包括大模型基础认知、核心技术(RAG、Prompt、Agent)、开发能力、应用场景、项目落地及面试准备。指出大模型技术虽迭代快但核心逻辑不变,为想转行AI的开发者提供系统化学习框架和资料。
2026-01-05 15:06:47
539
原创 【AI编程黑科技】R2R:多模态+深度研究+知识图谱,这个RAG系统直接卷到飞起!
R2R是一个生产就绪的AI检索系统,支持检索增强生成(RAG)技术,具备多模态内容摄取、混合搜索、知识图谱和深度研究API等高级功能。与传统RAG不同,它提供完整的RESTful API设计,支持文本、图片、音频等多种格式,内置多步骤推理系统,能自动抽取知识图谱并动态调整检索策略。R2R开箱即用,集成成本低,部署友好,解决了"能跑≠能用,能用≠能进生产"的痛点,是小白程序员和大模型开发者的理想选择。
2026-01-04 14:54:04
875
原创 RAG架构从入门到精通,一篇搞定AI“胡说八道”,收藏这一篇就够了!
本文详解9种RAG架构及其适用场景,提供选择框架和决策指南。RAG技术能减少大模型"幻觉",提高回答准确性。强调从简单开始、持续评估、避免过度设计的重要性,是企业安全采用生成式AI的关键技术。
2026-01-04 14:53:25
857
原创 【爆肝干货】Deep Thinking RAG架构横空出世:传统RAG被吊打,小白程序员也能秒变AI大神!
文章介绍了传统RAG系统的局限性,提出了Deep Thinking RAG架构,通过将RAG与Agent技术深度融合,实现了从"工具"向"智能体"的范式跃迁。该架构包含规划代理、检索监督者等四个智能模块,通过LangGraph编排实现循环推理机制。实战对比显示,Deep Thinking RAG在Context Precision、Context Recall和Answer Correctness等指标上显著优于传统RAG,为企业级AI应用提供了新的技术范式。
2026-01-04 14:45:33
650
原创 从Java到Agent开发:3个月转型指南,轻松掌握大模型应用核心能力
2026年的程序员赛道,早已不是“会写代码就稳了”的时代——某大厂消息显示,引入AI Agent协作后,30人的基础架构组仅需5人留存,被淘汰的多是固守传统开发、拒绝拥抱AI的开发者。而另一边,Agent(智能体)开发岗位月薪已飙至5万+,市场疯狂争抢兼具Java工程能力与AI思维的复合型人才。深耕Java多年的你,与其焦虑被AI替代,不如主动转型入局Agent开发——如何借助现有技术积累快速破局?
2026-01-04 14:44:58
870
原创 【程序员必看】RAG技术让大模型不再“胡说八道“,5大模块详解+实战案例,小白也能变专家!
RAG(检索增强生成)是一种解决LLM幻觉、时效性和数据安全问题的技术框架。文章详细介绍了RAG的五大核心模块:版面分析、知识库构建、大模型微调、文档检索和Reranker。同时提供了多个开源项目实战案例,帮助开发者从零构建基于RAG的知识问答系统,提升大模型回答的准确性、可解释性和安全性。
2026-01-04 14:44:13
849
原创 救命!RAG终于能理解复杂关系了!HGMEM框架让大模型推理能力原地起飞,代码已开源小白也能玩转!
HGMEM是港中大&WeChat AI团队提出的超图记忆框架,通过超图结构和动态演化机制解决多步RAG系统中的记忆静态化、关系建模薄弱和推理碎片化问题。该框架支持n元关系建模,通过更新、插入、合并三种操作实现记忆动态演化,并采用自适应检索策略。实验表明,HGMEM在多个数据集上显著优于现有方法,甚至在某些场景超越了GPT-4o的性能,为RAG技术向"理解-推理"跃迁提供了重要支撑。
2026-01-04 14:43:25
742
原创 AI技术大洗牌:RingAttention杀疯了,RAG如何绝地求生?开发者必看的技术演进路线
Ring Attention技术突破上下文限制,对RAG构成挑战但不会完全取代。由于成本、延迟等问题,RAG将进化为"长上下文RAG",与Ring Attention形成互补:RAG负责粗筛,Ring Attention负责精细推理。两者结合将推动AI从简单搜索转向真正的知识推理,RAG演变为上下文管理系统,Ring Attention成为超级推理核心,共同提升AI知识处理能力。
2026-01-04 14:42:26
550
原创 绝绝子!Spring Boot+LangChain4j实现RAG检索增强和多工具调用,AI开发从未如此简单!
本文详细介绍了如何使用Spring Boot和LangChain4j构建具备RAG检索增强和多工具调用能力的AI助手系统。从系统架构设计、依赖配置到对话记忆管理、知识库构建,再到天气查询、计算器、时间查询等工具实现和API开发,提供了完整的实战指南。通过这一系列技术,开发者可快速创建能结合知识库与外部工具的智能应用,大幅提升AI系统的实用性和回答准确率。
2026-01-04 14:41:51
882
原创 AI“一本正经胡说八道“有救了!电信海翠RAG平台技术揭秘,程序员必看!
中国电信研究院的海翠RAG平台通过信通院RAG能力专项测试,解决了大模型时效性差、易产生"幻觉"、难适配垂直场景等痛点。该平台采用"检索+生成"双阶段流程,集成多模态文档解析、智能检索优化、思维链校验和质量评估等功能,已在企业办公、人力资源、客服等领域落地应用,有效提升模型输出准确性和实用性,赋能企业数智化转型。
2026-01-04 14:39:44
723
原创 程序员必看!CPU缓存思想大迁移,解决企业级LLM“幻觉“难题
对于企业级RAG落地而言,核心价值不在于“是否用了检索+生成”,而在于“如何让检索更精准、上下文更完整、生成更可控”。本文提出的“上下文多级缓存架构”,核心优势就是借鉴CPU分层缓存思想,通过L1快速筛主题、L2精准锁上下文、L3回填权威事实,再配合结构感知切片与Re-ranker二次优化,从根源上解决了传统RAG“检索慢、精度低”的核心痛点。Gartner预测,2025年92%的企业将推进AI自动化落地,而高精度RAG架构将成为企业AI落地的核心基础设施。
2026-01-04 14:38:55
409
原创 AI硬件开发天花板:自研操作系统全解析,小白也能成为大模型应用专家
董红光:短期看,能不能让百万用户把耳机从"偶尔用"变成"一直戴"。中期看,开发者生态能不能自发长出我们想不到的应用。长期看,当AI硬件年出货量过亿时,我们是不是那10个核心玩家之一。我们不追求做老大,但要在牌桌上。
2026-01-02 11:15:00
1840
原创 Hinton最新暴论:大模型不需要逻辑符号!AI开发者看完直接破防了...
AI教父Hinton阐述大模型无需逻辑符号即可实现复杂推理,理解过程如同"语义积木"变形与握手。他预测AI将在医疗、教育领域成为顶级导师,在数学等闭环系统中全面超越人类。为突破Scaling Law瓶颈,未来LLM需通过逻辑推理自我生成数据实现进化。同时,Hinton警告AI存在接管世界的风险,反对无限制开源前沿模型,呼吁大幅增加安全研究投入。
2025-12-31 17:57:03
642
原创 20251231_174635_面向未来的_Agent_平台工程:架构探索与设计哲学
文章探讨了从简单AI应用到企业级Agent的转变,提出四层架构的Agent开发平台:基础设施层、平台层、接入层和全生命周期管理。文章详细阐述了如何在非确定性系统中建立确定性工程规范,包括Agent设计语言、LLM-as-a-Judge评测、记忆工程、沙箱安全等技术,探讨了通过工程手段在AI可能性与企业可靠性间建立秩序的路径。
2025-12-31 17:56:04
664
原创 小白福音:大模型Agent开发平台四层架构全解析,从炼丹到工业化的蜕变!
文章探讨了从简单AI应用到企业级Agent的转变,提出四层架构的Agent开发平台:基础设施层、平台层、接入层和全生命周期管理。文章详细阐述了如何在非确定性系统中建立确定性工程规范,包括Agent设计语言、LLM-as-a-Judge评测、记忆工程、沙箱安全等技术,探讨了通过工程手段在AI可能性与企业可靠性间建立秩序的路径。
2025-12-31 17:53:53
547
原创 大模型开发必看!从“造Agent“到“炼技能“:顶尖公司都在悄悄转型的秘密,小白也能秒懂!
AI Agent开发正从"数量堆砌"转向"技能沉淀"的范式转变。Skills具有流程性、可组合性和可执行性三大属性,通过`skill.md`文件、渐进式披露策略和模型与脚本分工,解决了传统Agent开发中的管理混乱、维护困难等问题。这一转变将重塑AI应用开发模式,未来企业竞争的核心是结构化知识组织方式,而非Agent数量。---
2025-12-31 17:52:42
864
原创 别再让客户看“中式英语”了!RAG翻译黑科技:代码小白也能用,让老板对你刮目相看
本文揭露AI领域常见的"装腔"现象,通过LLM、GPT/Claude/DeepSeek等模型对比、RAG技术解析,提供装腔者与真懂者的语言对照表。强调AI技术落地需关注token量、上下文窗口、向量检索等细节,而非空谈"喂给大模型"。帮助程序员识破伪专家,掌握大模型开发真技术,避免"装腔一时爽,落地火葬场"的尴尬局面。
2025-12-31 17:51:49
646
原创 震惊!大模型AI AGENT正在颠覆编程界,小白也能秒变“全栈大神“!代码助手进化成“智能管家“,不会用的程序员将被淘汰!
文章介绍了AI AGENT从传统"工具"向"管家"的转变,强调其主动思考、自主行动和灵活应变的能力。AI AGENT具有感知环境、自主规划、记忆学习和工具使用四大超能力,已在内容创作、财务管理和旅行规划等领域应用。到2026年,80%的日常数字任务将由AI AGENT代理完成,个人生产力将提升3-5倍。AI AGENT不是取代人类,而是成为能力倍增器,学会与AI共处将成为职场新标配。
2025-12-31 17:49:18
726
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅