智见AGI-CSDN博客

原创端侧 AI 的真实处境：一段工程复盘

本文是一篇关于端侧AI实践的工程复盘。作者通过一年多实际项目经历，揭示了端侧AI面临的现实挑战：本地大模型受限于15tokens/s的低速运行，NPU在PC端效果不如嵌入式设备突出，资源管理成为关键瓶颈。文章指出用户更看重体验而非隐私，端侧AI必须找到"只有本地能做"的独特价值。作者团队开发了模型纳管框架来解决资源冲突问题，但也意识到端侧AI的发展需要长期渗透操作系统和应用生态，而非短期技术突破。全文呈现了从技术浪漫主义到工程务实主义的转变过程。

2026-02-13 10:33:41 384

原创【技术加速器】当 AI Coding 从“辅助”走向“主力”：Claude Code 与 Skills 的真实使用笔记

《AI编程工具ClaudeCode的技术解析与应用指南》探讨了AI编程从辅助转向主力的趋势。文章重点分析了ClaudeCode的三大核心价值：1）支持连续执行的Agent化工作模式；2）提供ask-before-edits、edit-automatically和plan-mode三种风险控制机制；3）通过Skills系统实现经验复用。文章指出，AI编程最适合原型开发、自动化脚本等场景，但在安全关键系统和底层优化方面仍有局限。关键结论是：未来开发者的核心竞争力将从"写代码"转向"

2026-02-13 10:32:48 670

原创地铁广告刷屏的蚂蚁阿福，藏着一套世界级医疗AI技术

摘要：蚂蚁集团推出的AI健康助手"蚂蚁阿福"（AQ）基于多模态医疗大模型技术，实现了从工具型应用到陪伴型健康伙伴的转型。其核心技术包括：1）原生多模态架构，支持文本、图像、语音等多种医疗数据处理；2）医学思维推理能力，能像医生一样进行多轮问诊和鉴别诊断；3）创新的MedResearcher-R1框架，通过知识指引的智能体轨迹合成解决医疗AI训练难题；4）医生智能体生态，实现专家诊疗逻辑的数字化延伸。该技术体系显著提升了数据效率，将新专科模型开发所需样本从20万降至2000例，同时通过密态

2026-02-06 11:32:20 318

原创每周技术加速器：智能体记忆-不只是向量库，更是“可自我演化的认知状态”

本文探讨了智能体记忆系统的前沿发展与设计原则。文章指出当前记忆系统存在"遗忘、混乱、前后矛盾"等核心问题，并提出"三问框架"作为设计指南：记忆形式（Forms）、功能角色（Functions）和动态演化（Dynamics）。作者区分了事实记忆、经验记忆和工作记忆三种功能类型，强调记忆系统需要具备更新、整合、纠错和抽象能力。在技术实现上，讨论了Token-level、Parametric和Latent三种记忆形式的特点与适用场景。文章还分析了多模态记忆、多智能体共享和可

2026-02-06 11:31:00 482

原创重塑人机交互：深度解析智谱 Open-AutoGLM 的技术底座与演进之路

摘要：2025年12月，手机Agent技术迎来重要突破。字节跳动发布"豆包手机助手"后不久，智谱科技开源了完整的手机Agent系统OpenAutoGLM。该系统基于AutoGLM-Phone-9B模型，采用"截图感知-意图解析-动作规划-操作执行"的闭环机制，支持50余款主流应用。技术演进经历了从GUI感知到数字红包操作，再到云端沙箱和全面开源的三个阶段。当前系统仍需PC端协同运行，面临隐私保护、离线能力、个性化等挑战。开源标志着手机Agent进入开放探索阶段，未来将

2026-02-06 11:29:15 620

原创 banana-slides：把“做PPT”变成一次对话的开源项目

banana-slides是一款AI原生PPT生成工具，通过自然语言输入快速创建专业演示文稿。它支持三种输入方式（一句话、大纲、内容描述），自动生成结构化内容、统一风格的配图，并提供模板定制功能。相比传统工具，它解决了模板固定、改动困难、同质化等问题，实现"对话式创作"。技术采用React+Flask架构，支持OpenAI和Gemini模型，适合各类用户快速制作精美PPT。项目正在拓展图片编辑、多语种支持等功能，致力于提升PPT制作效率与质量。

2026-02-06 10:44:24 358

原创技术加速器—54种组合、4步炼金法：一文读透多模态 RAG 的全景地图

本文探讨了多模态检索增强生成（MM-RAG）的技术演进与应用前景。文章指出，AI竞争正从模型参数规模转向"上下文操作系统"能力，MM-RAG通过统一工作流整合跨模态信息检索与生成，推动AI从回答问题向可靠决策转变。综述了信息检索从关键词匹配到多模态整合的四阶段发展，提出基于输入-输出模态的54种组合分类框架，并详细拆解构建MM-RAG系统的"四步法"：预检索、检索、增强和生成。最后展望了MM-RAG在教育、医疗等领域的应用潜力，强调其在处理视频理解等复杂场景时的技术挑

2026-02-06 10:43:27 305

原创 AI终于有手了：GUI智能体如何“看见并点击”你的电脑

GUI智能体突破传统AI局限，实现"看见并操作"真实界面的能力。其核心在于多模态大模型对界面的语义理解，以及"观察-规划-执行-验证-恢复"的闭环流程。与传统RPA不同，GUI智能体以目标为导向，能自主决策并应对异常。落地关键在可靠性而非智能度，需具备安全权限、可控接管和全链路追溯机制。通过"失败回流"持续迭代，聚焦高频重复的企业流程（如周报生成、数据填报等），推动办公范式从"人适应软件"转向"意图驱动界面"

2026-02-06 10:42:31 454

原创每周技术加速器：UltraRAG：突破传统RAG架构的创新与实践

《UltraRAG：模块化RAG架构的革新实践》摘要本文介绍了基于MCP协议的UltraRAG框架，旨在解决传统RAG系统在工程实践中暴露的组件耦合、配置分散、调试困难等结构性问题。通过协议化接口、分层架构与配置驱动机制，UltraRAG实现了三大创新：1）采用YAML配置描述完整Pipeline，降低工程复杂度；2）建立标准化的MCP协议实现组件解耦；3）原生支持多模态处理能力。该框架将RAG从"应用代码"提升为"可演进系统架构"，通过可视化工具支持全流程可观测。

2025-12-26 14:59:09 701

原创除了 DeepSeek-OCR，还有谁在“把字当图看”？

【摘要】本文探讨了降低长文档处理成本的三种创新路线：1）OCR-free端到端文档理解，直接解析整页图像保留版式结构（如DeepSeek-OCR、Donut）；2）像素化语言建模，将文字转为像素表征增强跨语种鲁棒性（如PIXEL、CLIPPO）；3）token压缩技术，通过视觉/文本侧token合并减少计算量（如ToMe、LLMLingua）。这三种互补方案可构建自适应路由系统：复杂版式走OCR-free，多语言场景用像素化建模，常规长文本采用token压缩。实验表明，组合使用这些方法能在保留语义的同时显著

2025-12-25 14:33:39 550

原创 Andrej Karpathy：别急着“颠覆世界”，先把“坡道铺平”

AI专家Andrej Karpathy在访谈中表示，尽管大型语言模型取得突破，但实现通用人工智能(AGI)仍需约十年时间。他认为当前行业对"智能体之年"的预测过于乐观，更倾向于称之为"智能体十年"。Karpathy指出，AI发展面临七大关键挑战：1)智能体发展是长期演进而非突变；2)AI对齐需解决RLHF监督的局限性；3)智能体落地应采用渐进式"自治滑杆"；4)智能爆炸是持续过程而非突变；5)LLM需要建立文化传承机制；6)从演示到产品需经历漫长工

2025-12-25 14:31:01 878

原创阿里开源通义DeepResearch：智能体训练全流程揭秘

阿里通义实验室发布开源智能体系统DeepResearch，专为科研场景设计，能完成从检索到生成完整研究报告的全流程。该系统通过创新的数据合成、增量预训练、监督微调和强化学习四阶段训练方法，在多项高难度任务中取得SOTA成绩。DeepResearch已应用于高德地图智能出行和法律领域案例检索等场景，性能超越国际顶尖模型。团队公开了完整技术方案和开源链接，为智能体研发提供了可复现的方法论。

2025-12-24 14:37:36 830

原创 AI 智能体攻陷软件工程：从 SWE-Agent 到 SWE-Swiss，全景解析 AI4SE 最新战局

摘要：大语言模型在软件工程领域展现出巨大潜力，目前国内外已出现SWE-Agent、AutoCodeRover和SWE-Swiss等代表性研究。SWE-Agent通过Agent-Computer接口实现12.5%的bug修复准确率；AutoCodeRover利用AST解析将修复时间缩短至4分钟；SWE-Swiss结合强化学习取得60.2%的SOTA成绩。这些技术突破表明AI正从代码生成向完整开发流程演进，未来将通过多智能体协同、MoE模型优化等方向继续突破，推动"自编程"时代的到来。（14

2025-12-24 14:35:30 779

原创 Gemini 3.0 科普：Google 这次把 AI 做成“能看懂世界的助手”了

摘要：Gemini 3.0正在从单纯的聊天AI进化为能观察、分析和解决问题的数字助手。它具备多模态能力，能同时处理图片、视频、音频和文档，像人类一样"理解世界"而非简单识别。相比ChatGPT，Gemini更擅长分析结构、拆解复杂任务和图文视频理解。其核心升级包括：观察界面逻辑、分步执行长任务、处理超长内容等。未来，Gemini可能成为职场人的分析伙伴、文档阅读器和信息整理助手，代表AI正从"会聊天"向"能理解世界"的方向发展。

2025-12-19 15:37:52 530

原创世界模型：AI的下一个里程碑

摘要：世界模型是AI理解物理世界的核心技术，从心理学"心智模型"概念发展而来。通过低维表征、动态预测和反事实推理，世界模型让AI具备物理规律认知能力。OpenAI的Sora视频生成系统展示了世界模型的实际应用，虽仍存在物理交互不完善等问题，但已展现出3D空间理解能力。该技术在机器人、自动驾驶和游戏领域有广阔前景，但面临数据质量、物理一致性和计算效率等挑战。与语言模型互补，世界模型正推动AI从语言智能向空间智能转变，成为未来AI发展的重要方向。（149字）

2025-12-18 17:30:16 768

原创每周技术加速器：为什么下一代AI的竞争是“上下文操作系统“之争？

摘要：下一代AI竞争正从模型调优转向"上下文操作系统"设计。本文探讨了AI开发从提示词工程到上下文工程的范式迁移，揭示了构建智能上下文管理系统的四大核心功能：内存管理、任务调度、工具调用和缓存策略。文章指出，单纯增加上下文长度会导致性能衰减，并提出多级记忆系统、动态上下文窗口等解决方案。未来趋势包括RAG与长上下文的协同、记忆精细化治理以及多模态上下文融合。作者强调，AI应用的竞争优势将取决于上下文架构的设计质量而非模型规模，呼吁开发者完成从"操作员"到"

2025-12-12 11:32:15 984

原创使用大语言模型从零构建知识图谱（下）

本文介绍了使用LangChain的LLMGraphTransformer从文本构建知识图谱的方法。通过将电影数据集转换为文本文档，利用语言模型自动提取实体和关系，生成图结构文档并导入Neo4j数据库。文章详细说明了LLMGraphTransformer的参数配置、数据处理流程和异步转换过程，并展示了生成的节点和关系示例。最后演示了如何通过GraphCypherQAChain实现文本到Cypher查询的转换，进行图谱查询。这种方法显著提升了知识图谱构建的自动化程度，但作者指出仍需优化图谱结构和检索机制，未来将

2025-12-10 11:40:54 834

原创一个“神级”外挂——Google NotebookLM

它给我安全感和边界感，安全感体现在：每一个回答，它都会在句子末尾给你标一个小小的数字引用，你鼠标放上去，左边的原文就会自动高亮。在这个信息爆炸到让人窒息的年代，我们缺的从来不是生成更多垃圾文字的AI，而是一个能帮你把厚书读薄、把复杂变简单、把枯燥变有趣的工具。现在的AI圈子有个怪象：每天都有新模型号称“拳打GPT，脚踢Claude”，但真到了我们干活的时候，打开的界面依然是那几个熟悉的聊天框。如果你的电脑里躺着几百个用来“吃灰”的 PDF，或者你有永远听不完的播客、永远读不完的研报，这篇文章就是为你写的。

2025-12-09 15:45:08 1131

原创 Gemini 3.0 Pro Preview 实测报告

Gemini 3.0带来AI开发革命性升级，在推理深度、多模态理解和智能体构建上实现跨代突破。相比Gemini 2.5，新版本显著简化提示词工程，大幅提升视觉生成质量，在游戏开发、网页设计等场景中展现更专业的设计感和完成度。性能测试显示其在学术推理、编程能力和工具调用等方面全面领先，但预览版稳定性仍有待提升。配套发布的Antigravity IDE构建了从模型到开发工具链的完整生态，标志着AI正从代码助手向"开发伙伴"角色转变。

2025-11-26 14:50:37 1110

原创「干货长文」强化学习完全指南：从基础MDP到TRPO/PPO/GRPO算法演进

本文系统梳理了强化学习在大型语言模型(LLM)中的应用与发展。从马尔可夫决策过程(MDP)和贝尔曼方程等基础理论出发，详细分析了动态规划、蒙特卡洛和时序差分等经典算法，并深入探讨了PPO、GRPO等前沿优化方法。文章特别关注了强化学习如何通过任务拆解和奖励机制提升LLM的复杂问题解决能力，以及RLAIF、多智能体协同等未来发展方向。研究表明，强化学习正推动LLM进入2.0时代，成为实现模型对齐和提升推理能力的关键技术。

2025-11-21 11:28:42 774

原创效率翻倍！“Deep Research”技术，如何让你从信息海洋中精准淘金？

另一种是“认知增强”论，认为通过将繁琐、重复的低层次认知任务自动化，AI能解放我们的心智资源，让我们专注于更高层次的创造性、战略性思考，成为我们“延伸的大脑”。“天工”的架构中，“5大专家智能体”（分别专精于文档、PPT、表格、播客和网页的生成）和连接了众多工具的“通用智能体”，就扮演了这些专业化的“研究员”角色。这背后的根源在于，大语言模型的本质是概率性的“文字接龙”大师，而非事实数据库，它通过计算来预测下一个最有可能出现的词语以追求语言上的通顺，有时这会导致它“杜撰”出违背事实的细节。

2025-11-14 16:11:08 548

原创最高推理效率提升100%+｜让满血DeepSeekV3.1在L40S上大展身手

深度求索公司发布DeepSeekV3.1大模型，采用混合推理架构，支持思考与非思考模式切换。针对vLLM推理框架在跨节点通信的瓶颈，团队实施多项优化：1）计算图重排减少通信开销；2）采用分层多源广播模式；3）将Broadcast迁移至Ring All-Gather；4）优化All-Reduce为Reduce-Scatter+All-Reduce；5）设计混合并行策略解决负载均衡问题。通过计算维度变换，将AllReduce转为All-to-All+AllGather，显著降低通信开销。测试显示优化后性能最高提

2025-10-21 14:38:26 874

原创 A I智能革命——上下文工程新突破

摘要：AI交互正从提示词工程转向上下文工程，通过"写、选、压、隔"四大策略解决智能助手常见痛点。"写"策略赋予AI长期记忆能力；"选"策略实现精准知识筛选；"压"策略高效压缩信息；"隔"策略实现多Agent任务分解。这种思维转变将AI从工具升级为具有"认知自觉"的智能实体，但依然面临成本控制、安全保障等挑战。掌握这些策略能帮助开发者构建更健壮高效的AI应用，推动AIAgent向自我学习、自

2025-09-25 17:07:14 892

原创【AI洞察】别再只想着“让AI听你话”，人类也需要学习“适应AI”！

AI与人类应实现双向对齐：研究提出人机协同新范式最新研究指出，传统"人机对齐"过于单向，强调AI需双向理解人类价值，同时人类也应提升AI素养。论文提出双向对齐框架：一方面优化AI对人类价值的理解（69种核心价值分类），另一方面培养人类对AI的理解力与批判性思维。研究建议通过多模态互动、可扩展监督和长期共进策略，构建人机协同关系，而非简单的主从控制。该框架为AI伦理发展提供了新思路，强调人机关系是双向适应与共同进化的过程。

2025-09-25 17:05:47 367

原创全球第一个专业设计类AI Agent:Lovart

《Lovart：垂直深耕的AI设计Agent，让创意效率提升300%》摘要：2025年AI Agent爆发元年，通用型产品面临落地难题。Lovart作为专业设计Agent脱颖而出，通过"规划+执行+交付"全链路设计能力，实现创意效率300%的提升。核心功能包括：1）自动化任务拆解；2）多模态模型集成；3）智能图文分离技术；4）三种专业设计模式。在品牌视觉设计场景中，Lovart能快速生成高质量概念图和视频，简化传统多平台切换的复杂流程。与追求"万能"的通用Agent

2025-09-05 10:27:37 983

原创 2025中国AI客户端巅峰之战：超域博弈与熵减革命

AI客户端竞争已进入资源调度范式重构阶段，五强选手在技术路线和生态协同上展开激烈角逐。苹果端AI应用下载榜显示，DeepSeek、豆包等产品增速显著，但用户面临严重认知过载问题。五强产品各具特色：夸克专注极速搜索、DeepSeek强化技术性能、豆包依托抖音流量、腾讯元宝深耕长文本处理、纳米AI聚焦专业场景。技术突破集中在神经形态计算领域，IBM TrueNorth架构等创新正在重构人机交互范式。这场竞争本质是"熵减效率"的较量，获胜者需在技术突破与用户体验间找到平衡点，重新定义人机协同的

2025-09-05 10:25:57 1326

原创 Graph-RAG全面综述：如何用知识图谱+大模型解决信息检索难题？

本文《GraphRetrieval-AugmentedGeneration:ASurvey》综述了图增强检索生成（GraphRAG）技术，提出了一种整合图结构信息来解决大语言模型幻觉、知识缺乏等问题的框架。文章系统化梳理了GraphRAG三大核心环节：基于图的索引构建、图引导的检索策略和图增强的生成方法，并详细分析了各环节的技术实现与优化方向。研究指出，图数据的高质量索引是基础，需结合业务需求设计个性化图结构；检索阶段需平衡效率与准确性，采用混合检索器与多粒度策略；生成阶段则需适配不同任务选择合适的生成模型

2025-08-29 15:45:19 927

原创 Skywork：昆仑万维推出天工超级智能体

智能体系统，覆盖文档、PPT、表格、网页、播客五大高频场景，并依托通用智能体实现跨模态创作（如图片、音乐、视频生成）形成强大的多模态协同能力，结合其深度研究能力与灵活交互方式，真正为用户提供了一个集效率与品质于一体的解决方案。它不仅是一个工具，更像是一位具备“专。确认工作步骤后，Skywork将分阶段执行任务，其具备超强的Deep Research能力，通过调用MCP实现子步骤功能，并将具体步骤呈现给用户，所有文本与图片生成结果均自带信源标签，并根据搜索和分析得到的内容撰写总结，增强其可信度。

2025-08-29 15:44:11 1361

原创 Google、OpenAI和Anthropic Agent开发框架哪家强？

AI智能体开发领域三巨头技术对比：Google ADK采用A2A协议，支持多模态通信和复杂工作流，适合企业级协作；OpenAI SDK专注安全护栏功能，适合高风险场景；Anthropic ClaudeCode SDK强化代码能力，提示缓存可降本90%，适合开发场景。建议根据项目需求选择：复杂协作选Google，安全敏感选OpenAI，代码开发选Anthropic。随着模型能力提升，Agent功能正逐步内化，未来开发将更高效。

2025-08-29 15:41:51 1108

原创让大模型“记住”更多：RAG与长期记忆

RAG技术与长期记忆的融合实践 OpenAI近期强化了ChatGPT的记忆功能，通过RAG（检索增强生成）技术结合长期记忆系统，使AI既能调用外部知识库，又能记住用户个性化信息。RAG通过检索外部数据解决大模型"幻觉"问题，而长期记忆则采用向量数据库、结构化插槽和自动总结三种方式存储用户历史对话。当前主流方案是混合架构，如mem0的轻量级框架和MemGPT的类人脑记忆系统。二者的结合将重塑AI角色，在企业服务、智能客服和教育等场景实现更人性化交互。未来，具备上下文记忆能力的AI将更接近通

2025-06-18 17:12:51 1233

原创 AutoGLM沉思版：智能体推理的Deep Research探索

在这三大方向上，AutoGLM沉思版已呈现出一定的“前技术形态”：其内嵌的Operator工具集本质上为Agent OS提供了工具调用基础，其任务拆解与多轮推理机制初步构建了任务状态图，而通过不同推理Agent的阶段调用与信息反馈，也开始探索原始形态的智能体协同机制。举例而言，若提示其“请写一篇MCP和Function Call机制的技术差异报告”，系统将自动检索主流论文与API文档，在沉思推理过程中动态规划结构，输出多层级的技术对比分析，甚至带图表与引用文献。

2025-06-13 11:16:45 843

原创从DeepSeek-V3到DeepSeek-R1：中国AI团队的技术突破与创新

中国AI团队DeepSeek通过创新技术实现突破性进展。其DeepSeek-V3采用混合专家架构(MoE)和独创的多头潜在注意力机制(MLA)，在保持高效推理的同时实现性能提升。最新发布的DeepSeek-R1则通过多阶段强化学习训练策略，显著增强模型的推理能力与安全性。团队不盲目追求参数量，而是通过架构创新和算法优化，使模型在同等资源下表现更优。这些突破性技术标志着中国AI从"跟跑"向"领跑"转变，为全球人工智能发展贡献了新的技术范式。

2025-06-13 11:14:53 855

原创深度解析MCP协议

MCP协议是Anthropic推出的标准化协议，用于规范大型语言模型与外部数据源及工具的交互方式。该协议采用客户端-服务器架构，包含主机、客户端和服务器三个核心组件，支持工具调用、数据访问和提示模板等功能。通过Python SDK可实现项目初始化、服务器部署等操作，使AI模型能够执行复杂任务如数据写入Elasticsearch索引等。MCP协议的推出将推动AI从封闭系统向开放智能代理发展，有望构建全新AI工具生态，为开发者提供创新机遇，同时为企业深度整合AI与业务流程提供标准化路径。

2025-05-30 13:16:58 1122

原创大模型哲学：语言的边界就是世界的边界

文章探讨了大语言模型（AI）如何重新定义人类认知和语言边界，借助维特根斯坦的哲学理论进行分析。维特根斯坦早期认为语言是现实的映射，而后期则强调语言的意义在于其使用。AI的发展突破了传统符号主义的限制，通过统计学习和神经网络，AI不仅能够识别语言结构，还能生成新的语义关联，模拟“语言游戏”。然而，AI缺乏人类的具身经验，限制了其在处理感官和情感语言时的表现。随着多模态技术的发展，AI正在融合视觉、听觉等感知通道，进一步挑战“智能”与“主体性”的传统定义。文章最终提出，AI的语言革命不仅是对人类语言规则的复刻，

2025-05-14 17:44:16 1871

原创 DeepSearcher：开启智能搜索新纪元，赋能企业级数据研究

DeepSearcher是一款创新的智能搜索工具，专为满足企业级数据研究需求而设计。它结合了大型语言模型、超级搜索功能和本地化部署的优势，提供了一个高效、灵活且经济的研究解决方案。DeepSearcher通过将复杂查询拆解为多个子问题，利用智能查询路由和动态检索技术，从多个数据源中提取和整合信息，确保搜索结果的全面性和准确性。此外，其支持私有化部署，保障了数据的安全性和隐私性。DeepSearcher的AgenticRAG架构使其在处理复杂推理任务和报告生成方面表现出色，广泛应用于学术研究、市场分析等领域，

2025-05-14 17:41:41 1070

原创 24G显存也能跑DeepSeek-R1 671B？Ktransformers！

随着大语言模型技术的快速发展，模型参数规模不断扩大，显存需求也随之激增。如何在保证推理性能的同时降低显存占用，成为科研人员关注的重点。2025年1月，DeepSeek团队发布了DeepSeek-r1模型，尽管其性能逼近OpenAI的GPT-o1，但其671B的参数量使得推理所需显存高达数百GB，通常需要配备至少8张80GB显存的H800服务器。对于个人开发者和爱好者而言，这种硬件配置成本高昂。然而，清华大学KVCache.AI项目团队联合ApproachingAI开发的Ktransformers框架，通过内

2025-05-14 17:37:40 1271

原创数智驱动——AI：企业数字化转型的“超级引擎”

随着生成式AI技术的快速发展，企业数字化转型进入新阶段。AI大模型如DeepSeek、GPT-4o等，正从通用型向行业垂直领域延伸，推动企业基础设施的智能化变革。多模态模型、强化学习等技术进一步拓展了AI的应用场景，助力企业在复杂业务中实现高效决策和资源优化。AI不仅提升了企业效率，还重构了商业模式，优化了客户体验。通过本地化部署，企业确保了数据隐私和安全，同时提升了数据处理速度和精度。AI与云计算、5G等技术的深度融合，为企业提供了强大的计算能力和灵活的资源配置，推动了全行业的智能化和数字化转型。未来，企

2025-05-14 17:35:23 1033

原创 “十倍工程师”还有多远？

准备好了吗？我要打10个？©作者|Zhongmei来源|神州问学十倍工程师（10x Engineer）指代那些被认为效率远超普通工程师的程序员。这个话题总是引发强烈的情绪反应，因为它触及了一些深层次的观念：是否真的存在天赋高低的差异？这种差异是与生俱来的还是可以改变的？如果确实存在，我们应该如何对待这些不同的人？因此，是科技领域备受争议的概念：支持者认为，认为10倍工程师的存在是不言自明的事实，，其技术能力在解决复杂问题时表现尤为突出。例如，LeetCode竞赛中顶尖选手的效率可比普通开发者高出数十倍。否认

2025-05-14 17:17:15 680

原创 “小显存”也能启动大模型

DeepSeek技术通过创新的混合专家架构（MoE）解决了传统大模型在计算资源和效率上的瓶颈。MoE架构通过动态选择最合适的专家网络来处理不同任务，显著提高了计算效率和资源利用率。这种架构包括专家网络和门控网络，前者负责处理特定类型的数据，后者则根据输入数据特点选择最合适的专家。DeepSeek-V3模型拥有6710亿参数，但在推理时仅激活370亿参数，这大大减少了计算成本和显存占用。尽管MoE在训练稳定性和显存压力方面面临挑战，但其在计算效率、模型扩展性和灵活性上的优势使其成为大模型发展的有力候选。随着技

2025-05-14 16:36:27 815

原创开源长期主义：浅谈DeepSeek技术主张与早期论文

DeepSeek公司通过开源和长期主义的技术愿景，致力于推动大语言模型和多模态模型的发展。其技术路径包括探索扩展法则（Scaling Law）、混合专家架构（MoE）、代码生成与定理证明、以及视觉-语言理解等领域。DeepSeek在早期发布的论文中，提出了非传统扩展法则，开发了DeepSeekLLM和DeepSeekMoE模型，显著提升了模型性能和效率。此外，DeepSeek-Coder和DeepSeek-Prover模型在代码生成和定理证明任务中表现出色，缩小了开源与闭源模型的性能差距。DeepSeek-

2025-05-14 15:46:04 1222

空空如也

空空如也