自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(156)
  • 收藏
  • 关注

原创 端侧 AI 的真实处境:一段工程复盘

本文是一篇关于端侧AI实践的工程复盘。作者通过一年多实际项目经历,揭示了端侧AI面临的现实挑战:本地大模型受限于15tokens/s的低速运行,NPU在PC端效果不如嵌入式设备突出,资源管理成为关键瓶颈。文章指出用户更看重体验而非隐私,端侧AI必须找到"只有本地能做"的独特价值。作者团队开发了模型纳管框架来解决资源冲突问题,但也意识到端侧AI的发展需要长期渗透操作系统和应用生态,而非短期技术突破。全文呈现了从技术浪漫主义到工程务实主义的转变过程。

2026-02-13 10:33:41 384

原创 【技术加速器】当 AI Coding 从“辅助”走向“主力”:Claude Code 与 Skills 的真实使用笔记

《AI编程工具ClaudeCode的技术解析与应用指南》探讨了AI编程从辅助转向主力的趋势。文章重点分析了ClaudeCode的三大核心价值:1)支持连续执行的Agent化工作模式;2)提供ask-before-edits、edit-automatically和plan-mode三种风险控制机制;3)通过Skills系统实现经验复用。文章指出,AI编程最适合原型开发、自动化脚本等场景,但在安全关键系统和底层优化方面仍有局限。关键结论是:未来开发者的核心竞争力将从"写代码"转向"

2026-02-13 10:32:48 670

原创 地铁广告刷屏的蚂蚁阿福,藏着一套世界级医疗AI技术

摘要:蚂蚁集团推出的AI健康助手"蚂蚁阿福"(AQ)基于多模态医疗大模型技术,实现了从工具型应用到陪伴型健康伙伴的转型。其核心技术包括:1)原生多模态架构,支持文本、图像、语音等多种医疗数据处理;2)医学思维推理能力,能像医生一样进行多轮问诊和鉴别诊断;3)创新的MedResearcher-R1框架,通过知识指引的智能体轨迹合成解决医疗AI训练难题;4)医生智能体生态,实现专家诊疗逻辑的数字化延伸。该技术体系显著提升了数据效率,将新专科模型开发所需样本从20万降至2000例,同时通过密态

2026-02-06 11:32:20 318

原创 每周技术加速器:智能体记忆-不只是向量库,更是“可自我演化的认知状态”

本文探讨了智能体记忆系统的前沿发展与设计原则。文章指出当前记忆系统存在"遗忘、混乱、前后矛盾"等核心问题,并提出"三问框架"作为设计指南:记忆形式(Forms)、功能角色(Functions)和动态演化(Dynamics)。作者区分了事实记忆、经验记忆和工作记忆三种功能类型,强调记忆系统需要具备更新、整合、纠错和抽象能力。在技术实现上,讨论了Token-level、Parametric和Latent三种记忆形式的特点与适用场景。文章还分析了多模态记忆、多智能体共享和可

2026-02-06 11:31:00 482

原创 重塑人机交互:深度解析智谱 Open-AutoGLM 的技术底座与演进之路

摘要:2025年12月,手机Agent技术迎来重要突破。字节跳动发布"豆包手机助手"后不久,智谱科技开源了完整的手机Agent系统OpenAutoGLM。该系统基于AutoGLM-Phone-9B模型,采用"截图感知-意图解析-动作规划-操作执行"的闭环机制,支持50余款主流应用。技术演进经历了从GUI感知到数字红包操作,再到云端沙箱和全面开源的三个阶段。当前系统仍需PC端协同运行,面临隐私保护、离线能力、个性化等挑战。开源标志着手机Agent进入开放探索阶段,未来将

2026-02-06 11:29:15 620

原创 banana-slides:把“做PPT”变成一次对话的开源项目

banana-slides是一款AI原生PPT生成工具,通过自然语言输入快速创建专业演示文稿。它支持三种输入方式(一句话、大纲、内容描述),自动生成结构化内容、统一风格的配图,并提供模板定制功能。相比传统工具,它解决了模板固定、改动困难、同质化等问题,实现"对话式创作"。技术采用React+Flask架构,支持OpenAI和Gemini模型,适合各类用户快速制作精美PPT。项目正在拓展图片编辑、多语种支持等功能,致力于提升PPT制作效率与质量。

2026-02-06 10:44:24 358

原创 技术加速器—54种组合、4步炼金法:一文读透多模态 RAG 的全景地图

本文探讨了多模态检索增强生成(MM-RAG)的技术演进与应用前景。文章指出,AI竞争正从模型参数规模转向"上下文操作系统"能力,MM-RAG通过统一工作流整合跨模态信息检索与生成,推动AI从回答问题向可靠决策转变。综述了信息检索从关键词匹配到多模态整合的四阶段发展,提出基于输入-输出模态的54种组合分类框架,并详细拆解构建MM-RAG系统的"四步法":预检索、检索、增强和生成。最后展望了MM-RAG在教育、医疗等领域的应用潜力,强调其在处理视频理解等复杂场景时的技术挑

2026-02-06 10:43:27 305

原创 AI终于有手了:GUI智能体如何“看见并点击”你的电脑

GUI智能体突破传统AI局限,实现"看见并操作"真实界面的能力。其核心在于多模态大模型对界面的语义理解,以及"观察-规划-执行-验证-恢复"的闭环流程。与传统RPA不同,GUI智能体以目标为导向,能自主决策并应对异常。落地关键在可靠性而非智能度,需具备安全权限、可控接管和全链路追溯机制。通过"失败回流"持续迭代,聚焦高频重复的企业流程(如周报生成、数据填报等),推动办公范式从"人适应软件"转向"意图驱动界面"

2026-02-06 10:42:31 454

原创 每周技术加速器:UltraRAG:突破传统RAG架构的创新与实践

《UltraRAG:模块化RAG架构的革新实践》摘要 本文介绍了基于MCP协议的UltraRAG框架,旨在解决传统RAG系统在工程实践中暴露的组件耦合、配置分散、调试困难等结构性问题。通过协议化接口、分层架构与配置驱动机制,UltraRAG实现了三大创新:1)采用YAML配置描述完整Pipeline,降低工程复杂度;2)建立标准化的MCP协议实现组件解耦;3)原生支持多模态处理能力。该框架将RAG从"应用代码"提升为"可演进系统架构",通过可视化工具支持全流程可观测。

2025-12-26 14:59:09 701

原创 除了 DeepSeek-OCR,还有谁在“把字当图看”?

【摘要】本文探讨了降低长文档处理成本的三种创新路线:1)OCR-free端到端文档理解,直接解析整页图像保留版式结构(如DeepSeek-OCR、Donut);2)像素化语言建模,将文字转为像素表征增强跨语种鲁棒性(如PIXEL、CLIPPO);3)token压缩技术,通过视觉/文本侧token合并减少计算量(如ToMe、LLMLingua)。这三种互补方案可构建自适应路由系统:复杂版式走OCR-free,多语言场景用像素化建模,常规长文本采用token压缩。实验表明,组合使用这些方法能在保留语义的同时显著

2025-12-25 14:33:39 550

原创 Andrej Karpathy:别急着“颠覆世界”,先把“坡道铺平”

AI专家Andrej Karpathy在访谈中表示,尽管大型语言模型取得突破,但实现通用人工智能(AGI)仍需约十年时间。他认为当前行业对"智能体之年"的预测过于乐观,更倾向于称之为"智能体十年"。Karpathy指出,AI发展面临七大关键挑战:1)智能体发展是长期演进而非突变;2)AI对齐需解决RLHF监督的局限性;3)智能体落地应采用渐进式"自治滑杆";4)智能爆炸是持续过程而非突变;5)LLM需要建立文化传承机制;6)从演示到产品需经历漫长工

2025-12-25 14:31:01 878

原创 阿里开源通义DeepResearch:智能体训练全流程揭秘

阿里通义实验室发布开源智能体系统DeepResearch,专为科研场景设计,能完成从检索到生成完整研究报告的全流程。该系统通过创新的数据合成、增量预训练、监督微调和强化学习四阶段训练方法,在多项高难度任务中取得SOTA成绩。DeepResearch已应用于高德地图智能出行和法律领域案例检索等场景,性能超越国际顶尖模型。团队公开了完整技术方案和开源链接,为智能体研发提供了可复现的方法论。

2025-12-24 14:37:36 830

原创 AI 智能体攻陷软件工程:从 SWE-Agent 到 SWE-Swiss,全景解析 AI4SE 最新战局

摘要:大语言模型在软件工程领域展现出巨大潜力,目前国内外已出现SWE-Agent、AutoCodeRover和SWE-Swiss等代表性研究。SWE-Agent通过Agent-Computer接口实现12.5%的bug修复准确率;AutoCodeRover利用AST解析将修复时间缩短至4分钟;SWE-Swiss结合强化学习取得60.2%的SOTA成绩。这些技术突破表明AI正从代码生成向完整开发流程演进,未来将通过多智能体协同、MoE模型优化等方向继续突破,推动"自编程"时代的到来。(14

2025-12-24 14:35:30 779

原创 Gemini 3.0 科普:Google 这次把 AI 做成“能看懂世界的助手”了

摘要:Gemini 3.0正在从单纯的聊天AI进化为能观察、分析和解决问题的数字助手。它具备多模态能力,能同时处理图片、视频、音频和文档,像人类一样"理解世界"而非简单识别。相比ChatGPT,Gemini更擅长分析结构、拆解复杂任务和图文视频理解。其核心升级包括:观察界面逻辑、分步执行长任务、处理超长内容等。未来,Gemini可能成为职场人的分析伙伴、文档阅读器和信息整理助手,代表AI正从"会聊天"向"能理解世界"的方向发展。

2025-12-19 15:37:52 530

原创 世界模型:AI的下一个里程碑

摘要:世界模型是AI理解物理世界的核心技术,从心理学"心智模型"概念发展而来。通过低维表征、动态预测和反事实推理,世界模型让AI具备物理规律认知能力。OpenAI的Sora视频生成系统展示了世界模型的实际应用,虽仍存在物理交互不完善等问题,但已展现出3D空间理解能力。该技术在机器人、自动驾驶和游戏领域有广阔前景,但面临数据质量、物理一致性和计算效率等挑战。与语言模型互补,世界模型正推动AI从语言智能向空间智能转变,成为未来AI发展的重要方向。(149字)

2025-12-18 17:30:16 768

原创 每周技术加速器:为什么下一代AI的竞争是“上下文操作系统“之争?

摘要: 下一代AI竞争正从模型调优转向"上下文操作系统"设计。本文探讨了AI开发从提示词工程到上下文工程的范式迁移,揭示了构建智能上下文管理系统的四大核心功能:内存管理、任务调度、工具调用和缓存策略。文章指出,单纯增加上下文长度会导致性能衰减,并提出多级记忆系统、动态上下文窗口等解决方案。未来趋势包括RAG与长上下文的协同、记忆精细化治理以及多模态上下文融合。作者强调,AI应用的竞争优势将取决于上下文架构的设计质量而非模型规模,呼吁开发者完成从"操作员"到"

2025-12-12 11:32:15 984

原创 使用大语言模型从零构建知识图谱(下)

本文介绍了使用LangChain的LLMGraphTransformer从文本构建知识图谱的方法。通过将电影数据集转换为文本文档,利用语言模型自动提取实体和关系,生成图结构文档并导入Neo4j数据库。文章详细说明了LLMGraphTransformer的参数配置、数据处理流程和异步转换过程,并展示了生成的节点和关系示例。最后演示了如何通过GraphCypherQAChain实现文本到Cypher查询的转换,进行图谱查询。这种方法显著提升了知识图谱构建的自动化程度,但作者指出仍需优化图谱结构和检索机制,未来将

2025-12-10 11:40:54 834

原创 一个“神级”外挂——Google NotebookLM

它给我安全感和边界感,安全感体现在:每一个回答,它都会在句子末尾给你标一个小小的数字引用,你鼠标放上去,左边的原文就会自动高亮。在这个信息爆炸到让人窒息的年代,我们缺的从来不是生成更多垃圾文字的AI,而是一个能帮你把厚书读薄、把复杂变简单、把枯燥变有趣的工具。现在的AI圈子有个怪象:每天都有新模型号称“拳打GPT,脚踢Claude”,但真到了我们干活的时候,打开的界面依然是那几个熟悉的聊天框。如果你的电脑里躺着几百个用来“吃灰”的 PDF,或者你有永远听不完的播客、永远读不完的研报,这篇文章就是为你写的。

2025-12-09 15:45:08 1131

原创 Gemini 3.0 Pro Preview 实测报告

Gemini 3.0带来AI开发革命性升级,在推理深度、多模态理解和智能体构建上实现跨代突破。相比Gemini 2.5,新版本显著简化提示词工程,大幅提升视觉生成质量,在游戏开发、网页设计等场景中展现更专业的设计感和完成度。性能测试显示其在学术推理、编程能力和工具调用等方面全面领先,但预览版稳定性仍有待提升。配套发布的Antigravity IDE构建了从模型到开发工具链的完整生态,标志着AI正从代码助手向"开发伙伴"角色转变。

2025-11-26 14:50:37 1110

原创 「干货长文」强化学习完全指南:从基础MDP到TRPO/PPO/GRPO算法演进

本文系统梳理了强化学习在大型语言模型(LLM)中的应用与发展。从马尔可夫决策过程(MDP)和贝尔曼方程等基础理论出发,详细分析了动态规划、蒙特卡洛和时序差分等经典算法,并深入探讨了PPO、GRPO等前沿优化方法。文章特别关注了强化学习如何通过任务拆解和奖励机制提升LLM的复杂问题解决能力,以及RLAIF、多智能体协同等未来发展方向。研究表明,强化学习正推动LLM进入2.0时代,成为实现模型对齐和提升推理能力的关键技术。

2025-11-21 11:28:42 774

原创 效率翻倍!“Deep Research”技术,如何让你从信息海洋中精准淘金?

另一种是“认知增强”论,认为通过将繁琐、重复的低层次认知任务自动化,AI能解放我们的心智资源,让我们专注于更高层次的创造性、战略性思考,成为我们“延伸的大脑”。“天工”的架构中,“5大专家智能体”(分别专精于文档、PPT、表格、播客和网页的生成)和连接了众多工具的“通用智能体”,就扮演了这些专业化的“研究员”角色。这背后的根源在于,大语言模型的本质是概率性的“文字接龙”大师,而非事实数据库,它通过计算来预测下一个最有可能出现的词语以追求语言上的通顺,有时这会导致它“杜撰”出违背事实的细节。

2025-11-14 16:11:08 548

原创 最高推理效率提升100%+|让满血DeepSeekV3.1在L40S上大展身手

深度求索公司发布DeepSeekV3.1大模型,采用混合推理架构,支持思考与非思考模式切换。针对vLLM推理框架在跨节点通信的瓶颈,团队实施多项优化:1)计算图重排减少通信开销;2)采用分层多源广播模式;3)将Broadcast迁移至Ring All-Gather;4)优化All-Reduce为Reduce-Scatter+All-Reduce;5)设计混合并行策略解决负载均衡问题。通过计算维度变换,将AllReduce转为All-to-All+AllGather,显著降低通信开销。测试显示优化后性能最高提

2025-10-21 14:38:26 874

原创 A I智能革命——上下文工程新突破

摘要:AI交互正从提示词工程转向上下文工程,通过"写、选、压、隔"四大策略解决智能助手常见痛点。"写"策略赋予AI长期记忆能力;"选"策略实现精准知识筛选;"压"策略高效压缩信息;"隔"策略实现多Agent任务分解。这种思维转变将AI从工具升级为具有"认知自觉"的智能实体,但依然面临成本控制、安全保障等挑战。掌握这些策略能帮助开发者构建更健壮高效的AI应用,推动AIAgent向自我学习、自

2025-09-25 17:07:14 892

原创 【AI洞察】别再只想着“让AI听你话”,人类也需要学习“适应AI”!

AI与人类应实现双向对齐:研究提出人机协同新范式 最新研究指出,传统"人机对齐"过于单向,强调AI需双向理解人类价值,同时人类也应提升AI素养。论文提出双向对齐框架:一方面优化AI对人类价值的理解(69种核心价值分类),另一方面培养人类对AI的理解力与批判性思维。研究建议通过多模态互动、可扩展监督和长期共进策略,构建人机协同关系,而非简单的主从控制。该框架为AI伦理发展提供了新思路,强调人机关系是双向适应与共同进化的过程。

2025-09-25 17:05:47 367

原创 全球第一个专业设计类AI Agent:Lovart

《Lovart:垂直深耕的AI设计Agent,让创意效率提升300%》 摘要:2025年AI Agent爆发元年,通用型产品面临落地难题。Lovart作为专业设计Agent脱颖而出,通过"规划+执行+交付"全链路设计能力,实现创意效率300%的提升。核心功能包括:1)自动化任务拆解;2)多模态模型集成;3)智能图文分离技术;4)三种专业设计模式。在品牌视觉设计场景中,Lovart能快速生成高质量概念图和视频,简化传统多平台切换的复杂流程。与追求"万能"的通用Agent

2025-09-05 10:27:37 983

原创 2025中国AI客户端巅峰之战:超域博弈与熵减革命

AI客户端竞争已进入资源调度范式重构阶段,五强选手在技术路线和生态协同上展开激烈角逐。苹果端AI应用下载榜显示,DeepSeek、豆包等产品增速显著,但用户面临严重认知过载问题。五强产品各具特色:夸克专注极速搜索、DeepSeek强化技术性能、豆包依托抖音流量、腾讯元宝深耕长文本处理、纳米AI聚焦专业场景。技术突破集中在神经形态计算领域,IBM TrueNorth架构等创新正在重构人机交互范式。这场竞争本质是"熵减效率"的较量,获胜者需在技术突破与用户体验间找到平衡点,重新定义人机协同的

2025-09-05 10:25:57 1326

原创 Graph-RAG全面综述:如何用知识图谱+大模型解决信息检索难题?

本文《GraphRetrieval-AugmentedGeneration:ASurvey》综述了图增强检索生成(GraphRAG)技术,提出了一种整合图结构信息来解决大语言模型幻觉、知识缺乏等问题的框架。文章系统化梳理了GraphRAG三大核心环节:基于图的索引构建、图引导的检索策略和图增强的生成方法,并详细分析了各环节的技术实现与优化方向。研究指出,图数据的高质量索引是基础,需结合业务需求设计个性化图结构;检索阶段需平衡效率与准确性,采用混合检索器与多粒度策略;生成阶段则需适配不同任务选择合适的生成模型

2025-08-29 15:45:19 927

原创 Skywork:昆仑万维推出天工超级智能体

智能体系统,覆盖文档、PPT、表格、网页、播客五大高频场景,并依托通用智能体实现跨模态创作(如图片、音乐、视频生成)形成强大的多模态协同能力,结合其深度研究能力与灵活交互方式,真正为用户提供了一个集效率与品质于一体的解决方案。它不仅是一个工具,更像是一位具备“专。确认工作步骤后,Skywork将分阶段执行任务,其具备超强的Deep Research能力,通过调用MCP实现子步骤功能,并将具体步骤呈现给用户,所有文本与图片生成结果均自带信源标签,并根据搜索和分析得到的内容撰写总结,增强其可信度。

2025-08-29 15:44:11 1361

原创 Google、OpenAI和Anthropic Agent开发框架哪家强?

AI智能体开发领域三巨头技术对比:Google ADK采用A2A协议,支持多模态通信和复杂工作流,适合企业级协作;OpenAI SDK专注安全护栏功能,适合高风险场景;Anthropic ClaudeCode SDK强化代码能力,提示缓存可降本90%,适合开发场景。建议根据项目需求选择:复杂协作选Google,安全敏感选OpenAI,代码开发选Anthropic。随着模型能力提升,Agent功能正逐步内化,未来开发将更高效。

2025-08-29 15:41:51 1108

原创 让大模型“记住”更多:RAG与长期记忆

RAG技术与长期记忆的融合实践 OpenAI近期强化了ChatGPT的记忆功能,通过RAG(检索增强生成)技术结合长期记忆系统,使AI既能调用外部知识库,又能记住用户个性化信息。RAG通过检索外部数据解决大模型"幻觉"问题,而长期记忆则采用向量数据库、结构化插槽和自动总结三种方式存储用户历史对话。当前主流方案是混合架构,如mem0的轻量级框架和MemGPT的类人脑记忆系统。二者的结合将重塑AI角色,在企业服务、智能客服和教育等场景实现更人性化交互。未来,具备上下文记忆能力的AI将更接近通

2025-06-18 17:12:51 1233

原创 AutoGLM沉思版:智能体推理的Deep Research探索

在这三大方向上,AutoGLM沉思版已呈现出一定的“前技术形态”:其内嵌的Operator工具集本质上为Agent OS提供了工具调用基础,其任务拆解与多轮推理机制初步构建了任务状态图,而通过不同推理Agent的阶段调用与信息反馈,也开始探索原始形态的智能体协同机制。举例而言,若提示其“请写一篇MCP和Function Call机制的技术差异报告”,系统将自动检索主流论文与API文档,在沉思推理过程中动态规划结构,输出多层级的技术对比分析,甚至带图表与引用文献。

2025-06-13 11:16:45 843

原创 从DeepSeek-V3到DeepSeek-R1:中国AI团队的技术突破与创新

中国AI团队DeepSeek通过创新技术实现突破性进展。其DeepSeek-V3采用混合专家架构(MoE)和独创的多头潜在注意力机制(MLA),在保持高效推理的同时实现性能提升。最新发布的DeepSeek-R1则通过多阶段强化学习训练策略,显著增强模型的推理能力与安全性。团队不盲目追求参数量,而是通过架构创新和算法优化,使模型在同等资源下表现更优。这些突破性技术标志着中国AI从"跟跑"向"领跑"转变,为全球人工智能发展贡献了新的技术范式。

2025-06-13 11:14:53 855

原创 深度解析MCP协议

MCP协议是Anthropic推出的标准化协议,用于规范大型语言模型与外部数据源及工具的交互方式。该协议采用客户端-服务器架构,包含主机、客户端和服务器三个核心组件,支持工具调用、数据访问和提示模板等功能。通过Python SDK可实现项目初始化、服务器部署等操作,使AI模型能够执行复杂任务如数据写入Elasticsearch索引等。MCP协议的推出将推动AI从封闭系统向开放智能代理发展,有望构建全新AI工具生态,为开发者提供创新机遇,同时为企业深度整合AI与业务流程提供标准化路径。

2025-05-30 13:16:58 1122

原创 大模型哲学:语言的边界就是世界的边界

文章探讨了大语言模型(AI)如何重新定义人类认知和语言边界,借助维特根斯坦的哲学理论进行分析。维特根斯坦早期认为语言是现实的映射,而后期则强调语言的意义在于其使用。AI的发展突破了传统符号主义的限制,通过统计学习和神经网络,AI不仅能够识别语言结构,还能生成新的语义关联,模拟“语言游戏”。然而,AI缺乏人类的具身经验,限制了其在处理感官和情感语言时的表现。随着多模态技术的发展,AI正在融合视觉、听觉等感知通道,进一步挑战“智能”与“主体性”的传统定义。文章最终提出,AI的语言革命不仅是对人类语言规则的复刻,

2025-05-14 17:44:16 1871

原创 DeepSearcher:开启智能搜索新纪元,赋能企业级数据研究

DeepSearcher是一款创新的智能搜索工具,专为满足企业级数据研究需求而设计。它结合了大型语言模型、超级搜索功能和本地化部署的优势,提供了一个高效、灵活且经济的研究解决方案。DeepSearcher通过将复杂查询拆解为多个子问题,利用智能查询路由和动态检索技术,从多个数据源中提取和整合信息,确保搜索结果的全面性和准确性。此外,其支持私有化部署,保障了数据的安全性和隐私性。DeepSearcher的AgenticRAG架构使其在处理复杂推理任务和报告生成方面表现出色,广泛应用于学术研究、市场分析等领域,

2025-05-14 17:41:41 1070

原创 24G显存也能跑DeepSeek-R1 671B?Ktransformers!

随着大语言模型技术的快速发展,模型参数规模不断扩大,显存需求也随之激增。如何在保证推理性能的同时降低显存占用,成为科研人员关注的重点。2025年1月,DeepSeek团队发布了DeepSeek-r1模型,尽管其性能逼近OpenAI的GPT-o1,但其671B的参数量使得推理所需显存高达数百GB,通常需要配备至少8张80GB显存的H800服务器。对于个人开发者和爱好者而言,这种硬件配置成本高昂。然而,清华大学KVCache.AI项目团队联合ApproachingAI开发的Ktransformers框架,通过内

2025-05-14 17:37:40 1271

原创 数智驱动——AI:企业数字化转型的“超级引擎”

随着生成式AI技术的快速发展,企业数字化转型进入新阶段。AI大模型如DeepSeek、GPT-4o等,正从通用型向行业垂直领域延伸,推动企业基础设施的智能化变革。多模态模型、强化学习等技术进一步拓展了AI的应用场景,助力企业在复杂业务中实现高效决策和资源优化。AI不仅提升了企业效率,还重构了商业模式,优化了客户体验。通过本地化部署,企业确保了数据隐私和安全,同时提升了数据处理速度和精度。AI与云计算、5G等技术的深度融合,为企业提供了强大的计算能力和灵活的资源配置,推动了全行业的智能化和数字化转型。未来,企

2025-05-14 17:35:23 1033

原创 “十倍工程师”还有多远?

准备好了吗?我要打10个?©作者|Zhongmei来源|神州问学十倍工程师(10x Engineer)指代那些被认为效率远超普通工程师的程序员。这个话题总是引发强烈的情绪反应,因为它触及了一些深层次的观念:是否真的存在天赋高低的差异?这种差异是与生俱来的还是可以改变的?如果确实存在,我们应该如何对待这些不同的人?因此,是科技领域备受争议的概念:支持者认为,认为10倍工程师的存在是不言自明的事实,,其技术能力在解决复杂问题时表现尤为突出。例如,LeetCode竞赛中顶尖选手的效率可比普通开发者高出数十倍。否认

2025-05-14 17:17:15 680

原创 “小显存”也能启动大模型

DeepSeek技术通过创新的混合专家架构(MoE)解决了传统大模型在计算资源和效率上的瓶颈。MoE架构通过动态选择最合适的专家网络来处理不同任务,显著提高了计算效率和资源利用率。这种架构包括专家网络和门控网络,前者负责处理特定类型的数据,后者则根据输入数据特点选择最合适的专家。DeepSeek-V3模型拥有6710亿参数,但在推理时仅激活370亿参数,这大大减少了计算成本和显存占用。尽管MoE在训练稳定性和显存压力方面面临挑战,但其在计算效率、模型扩展性和灵活性上的优势使其成为大模型发展的有力候选。随着技

2025-05-14 16:36:27 815

原创 开源长期主义:浅谈DeepSeek技术主张与早期论文

DeepSeek公司通过开源和长期主义的技术愿景,致力于推动大语言模型和多模态模型的发展。其技术路径包括探索扩展法则(Scaling Law)、混合专家架构(MoE)、代码生成与定理证明、以及视觉-语言理解等领域。DeepSeek在早期发布的论文中,提出了非传统扩展法则,开发了DeepSeekLLM和DeepSeekMoE模型,显著提升了模型性能和效率。此外,DeepSeek-Coder和DeepSeek-Prover模型在代码生成和定理证明任务中表现出色,缩小了开源与闭源模型的性能差距。DeepSeek-

2025-05-14 15:46:04 1222

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除