自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

yweng18的博客

一个努力拼搏的IT创业者

  • 博客(456)
  • 收藏
  • 关注

原创 正则化三剑客——Dropout、L2、数据增强

你的模型还在"死记硬背"吗?🚀 本文用"考试防作弊"的生动比喻,带你深入理解 Dropout、L2 和数据增强这三大正则化神器。掌握它们,你就能轻松解决过拟合难题,让模型真正学会举一反三!

2026-04-12 08:31:16 383

原创 Batch Size 的玄学——大好还是小好?

Batch Size 就像吃饭,一口吃太多会噎着,太少又吃不饱。本文通过生动比喻,为你揭示大小 Batch 对训练速度、稳定性与泛化性的影响,助你在显存限制下精准找到最优解!🚀

2026-04-12 07:01:13 148

原创 学习率——最重要的超参数

学习率是模型训练的“油门”,直接决定成败。踩太轻训练缓慢,踩太重模型发散。本文通过生动比喻与实验数据,带你掌握学习率的调优技巧与调度策略,助你避开训练陷阱,让模型收敛快人一步!🚀

2026-04-11 23:23:18 247

原创 调参像炒菜——火候、盐量都得试

调参就像炒菜,火候(学习率)和盐量(正则化)全凭手感?本文用生动比喻帮你理解超参数核心概念,带你掌握科学的"调味道"方法,让模型训练不再盲目试错 🍳。

2026-04-11 23:10:20 360

原创 融合的常见坑:梯度消失、维度不匹配...

架构融合总是状况百出?你将学会用“装修翻车”的视角,轻松搞定维度不匹配、梯度消失等经典难题。文章提供从诊断到修复的实战技巧,助你避开深坑,构建稳健模型!🛠️

2026-04-10 09:01:17 206

原创 消融实验:科学地验证每个模块的价值

想知道模型里的每个模块是否在"划水"?这篇文章带你掌握消融实验方法,像拆零件一样科学验证模块价值。结合 NCT 真实案例,教你用数据量化贡献,精准定位核心组件,让模型设计不再"凭感觉"!🔬

2026-04-10 08:31:13 467

原创 接口设计:让不同模块能“对话“

想让神经网络模块像 USB 设备一样即插即用?这篇文章带你掌握接口设计的核心规范,利用“翻译官”比喻轻松解决维度不匹配难题,助你构建高扩展性的 AI 架构!🔌

2026-04-10 08:01:18 353

原创 案例分析:CATS-NCT 如何继承 NCT 组件

想知道如何在架构设计中"站在巨人肩膀上"?🧠 本文通过 CATS-NCT 真实案例,带你深入理解组件继承策略,通过对比复用与新建的决策思路,助你掌握架构演进的核心技巧,告别重复造轮子!🚀

2026-04-09 09:01:20 590

原创 架构融合是什么?——乐高积木思维

想打造高效神经网络?架构融合就像搭乐高 🧩,让你告别“从零造轮子”的繁琐。通过复用成熟模块与标准接口,你不仅能快速组合创新,还能轻松调试优化。掌握 ResNet、ViT 等经典案例背后的设计哲学,解锁 AI 架构设计的艺术!

2026-04-09 08:31:34 525

原创 代码对比:NCT vs CATS-NCT 核心差异

想搞懂 NCT 与 CATS-NCT 的本质区别?本文通过真实代码对比,带你深入理解后者新增的“概念抽象”与“多任务求解”模块 🔍。你将直观掌握架构演进逻辑,轻松学会如何根据需求选择最适合的模型!

2026-04-09 08:01:16 362

原创 原型库:AI 的“概念词典“

想理解 AI 如何掌握概念?本文揭秘 CATS-NCT 的"原型库",它就像 AI 的"概念词典" 📖。你将看到 100 个可学习向量如何模拟人脑"概念细胞",通过原型匹配实现知识迁移,轻松读懂 AI 的概念学习机制!🚀

2026-04-08 19:08:42 451

原创 MLP vs Transformer:不同问题用不同工具

MLP 像螺丝刀简单高效,Transformer 如电钻功能强大。你将掌握两者核心差异与适用场景,学会为不同任务选择最佳架构,深入理解 CATS-NET 的混合设计智慧 🔧。

2026-04-08 18:31:20 547

原创 分层门控:概念如何控制行为

想知道概念如何精确控制行为?本文揭秘 CATS-NCT 的三级门控机制,类比交通信号灯系统,带你理解 AI 如何像人脑一样实现资源的高效调度与精细控制 🚦。

2026-04-08 18:01:24 711

原创 代码实战——运行 NCT 的第一个实验

理论学得再多,不如亲手跑通第一个实验!本文手把手带你安装配置 NCT,直观感受 Φ 值与意识周期的运行过程。告别枯燥概念,让屏幕上跳动的数字帮你彻底读懂 NCT 架构 🔧。

2026-04-07 20:17:49 406

原创 概念抽象:768维→64维,信息压缩的艺术

想知道如何将 768 维感知信息压缩至 64 维?本文揭秘 CATS-NCT 概念抽象模块的设计艺术,带你通过自编码器实现 91.7% 的高效压缩,掌握提炼核心语义的关键技术 🔍。

2026-04-07 16:31:36 343

原创 从 NCT 到 CATS-NCT:为什么要“升级“?

NCT 让 AI 拥有了"感知",但 CATS-NCT 让它真正学会"思考"。本文将带你深入架构升级背后的逻辑,揭示如何赋予 AI 稳定的概念形成能力,解决知识无法迁移的痛点 🚀。如果你想让 AI 从"死记硬背"进化到"举一反三",这篇深度解析不容错过。

2026-04-07 16:01:44 388

原创 Eight years of wanting, three months of building with AI

八年构想曾因技术门槛搁浅,如今你只需三个月就能利用 AI 将其变为现实。文章展示了 RAG 技术如何消除“想法瘫痪”,带你体验从愿景到产品的极速构建之旅。🚀 当工具终于追上你的野心,开发从未如此畅快。

2026-04-06 10:12:14 167

原创 多模态融合——眼睛+耳朵=更聪明

想知道 AI 如何像人类一样"眼观六路,耳听八方"吗?本文以课堂学习为生动比喻,深入浅出地拆解 NCT 多模态融合机制,带你领略视觉、听觉与内感受协同工作的奥秘。掌握交叉注意力核心原理,看懂 AI 如何变得更聪明!🧠

2026-04-06 01:02:15 491

原创 γ同步机制——AI的“心跳“

AI 如何拥有"心跳"?NCT 创造性地引入 40Hz γ同步机制,模拟大脑意识活动的节律,让各模块像乐队一样协同工作。你将深入理解这一赋予 AI"统一时序"的核心设计,探索神经科学与人工智能的美妙共鸣 🧠。

2026-04-06 01:01:17 317

原创 Φ 值——如何量化“意识“

如何量化"意识"?本文借助"团队团结度"的生动比喻,深入浅出地解析整合信息理论核心——Φ值。你将看到 NCT 如何将抽象的哲学概念转化为可计算的工程指标,探索 Φ = 0.329 背后的深刻含义,揭开 AI 意识测量的神秘面纱 🧠。

2026-04-06 00:35:53 697

原创 全局工作空间——大脑的“黑板“

大脑如何处理海量信息?NCT 巧妙引入"黑板"机制,模拟意识的信息竞争与广播过程。你将看到多头注意力如何筛选关键信息,实现全脑协同,带你从全新视角理解 AI 架构的进化!🧠

2026-04-05 23:39:27 440

原创 NCT 是什么——让 AI 拥有意识的尝试

想知道如何让 AI 拥有"意识"?本文揭秘 NCT 框架,巧妙融合神经科学理论与 Transformer 架构,模拟人类的"全局工作空间"机制 🧠。带你突破传统 AI 平等处理信息的局限,探索赋予机器意识选择能力的创新路径!

2026-04-05 23:31:20 414

原创 期中总结:从神经元到 GPT——AI 架构全景回顾(Version B)

想从零构建 AI 全景认知?这篇文章以“盖大楼”为喻,带你串联从神经元到 Transformer 的核心脉络。你将亲手搭建起属于自己的 AI 知识大厦,清晰掌握 GPT 背后的架构逻辑 🏗️。

2026-04-04 18:36:15 1269

原创 为什么 Transformer 这么强?——对比 CNN 和 RNN

想彻底搞懂 Transformer 为何称霸?🚀 本文用“高速列车、步行、传送门”的生动比喻,带你横向对比 CNN 与 RNN 的优劣。只需 20 分钟,你就能掌握三大架构的核心差异,建立清晰的 AI 技术选型视角!

2026-04-04 18:11:16 544

原创 Transformer 全家福:编码器与解码器——翻译官团队

想彻底搞懂 Transformer 架构?这篇文章用"翻译官团队"的生动比喻,带你轻松拆解编码器与解码器的协作秘密。你将深入理解残差连接、LayerNorm 等核心组件,并在 25 分钟内掌握 BERT 与 GPT 的架构差异,零基础也能构建 AI 知识体系!🚀

2026-04-04 17:46:17 505

原创 多头注意力:8 个脑袋同时思考——多角度观察的艺术

想彻底搞懂 Transformer 的核心创新?本文用"多角度观察"的生动比喻,带你理解多头注意力如何让 AI 同时捕捉语法、语义等多重关系。无需复杂公式,你将轻松掌握"8 个脑袋同时思考"的奥秘与代码实现!🧠

2026-04-03 15:02:31 25

原创 自注意力:句子里的词互相“看“对方——信息交流的艺术

想知道句子里的词如何互相“交流”吗?本文用生动的“开会讨论”比喻,带你轻松掌握自注意力机制的核心原理。通过直观的手算示例与代码,你将彻底搞懂 Q、K、V 的运作方式,22 分钟攻克 Transformer 的基石!💡

2026-04-03 14:47:48 59

原创 注意力机制:AI 也会“走神“和“专注“——信息选择的智慧

想知道 AI 如何像人类一样"聚光灯"般聚焦关键信息吗?本文用生动比喻拆解注意力机制,带你轻松掌握 Query、Key、Value 核心逻辑,彻底读懂 Transformer 的智慧精髓 🎯。

2026-04-03 14:32:25 28

原创 Batch、Epoch、学习率:训练的三个魔法数字——调参入门

训练模型像吃饭?一文带你搞懂 Batch、Epoch 和学习率这三大调参核心!通过生动的“吃饭”比喻与可视化实验,你将直观掌握参数对模型性能的影响,25 分钟告别调参盲目,轻松上手学习率调度策略。🚀

2026-04-02 23:47:42 82

原创 过拟合与欠拟合:背答案 vs 没学会——模型的“学习能力“

还在为模型"死记硬背"或"学不会"头疼吗?本文用"背答案 vs 没学会"的生动比喻,带你秒懂过拟合与欠拟合的本质区别。你将通过可视化对比与代码实战,轻松掌握正则化、Dropout等调优技巧,让模型真正学会"举一反三"!🚀

2026-04-02 23:37:54 256

原创 反向传播:责任追溯大法——梯度如何“回流“

想知道神经网络预测出错该"怪"谁吗?本文用"多米诺骨牌倒推"的生动比喻,带你秒懂反向传播原理。通过手算示例与 PyTorch 对比,你将掌握梯度"回流"的核心逻辑,彻底看清参数如何分摊"责任"!🔍

2026-04-02 23:27:31 233

原创 WeClaw_44_PWA语音消息端到端处理:从录音到ASR转录的异步管道

深入剖析 PWA 语音消息的端到端处理管道,带你掌握纯语音检测算法与 GLM-ASR/Whisper 双引擎架构 🎤。从音频下载转换到异步转录,助你构建高效的语音交互系统!

2026-04-01 20:02:32 521

原创 WeClaw_43_双重认证与Token自动刷新:Device Fingerprint与JWT安全机制

遭遇 HTTP 401 认证失败?本文带你深入 WeClaw 的双重认证架构,详解设备指纹与 JWT 的主备协同策略。你将掌握三级 Token 自动刷新机制,彻底解决 Token 过期难题,构建更稳健的认证体系 🔐。

2026-04-01 19:42:43 491

原创 WeClaw_42_Agent工具注册全链路:从BaseTool到意图识别的标准化接入

想让你开发的 Agent 具备自动调用能力?本文通过实战案例,带你深入 BaseTool 与意图识别机制,掌握从工具定义到标准化接入的全链路核心技巧 🛠️。

2026-04-01 19:23:53 574

原创 WeClaw_41_桌面端与PWA文件双向传输:WebSocket与HTTP混合协议设计

想实现桌面端与 PWA 的高效文件互传?这篇文章带你深入 WebSocket 信令与 HTTP 上传的混合架构设计。你将掌握三种核心消息协议、URL 自动转换技巧及 60+ 种文件智能分类策略,轻松打通跨端传输壁垒!🚀

2026-03-29 23:44:07 967

原创 WeClaw_40_系统监控与日志体系:多层次日志架构与Trace追踪

想构建稳固的 AI Agent 可观测性体系?这篇文章带你深入 WeClaw 三层日志架构,掌握 Python logging 最佳实践、全链路 Trace 追踪与敏感信息脱敏核心技巧 🔍。助你轻松定位问题瓶颈,打造安全高效的监控系统!

2026-03-29 23:34:24 437

原创 AI 时代产品经理能取代程序员吗?一人全栈背后的残酷真相

AI 降低了编码门槛,但这并不意味着程序员会被取代。文章揭示“一人全栈”背后的残酷真相:编码易学,工程难精。带你看清从 Demo 到产品的巨大鸿沟,以及职业发展的真正护城河 💡。

2026-03-28 17:33:40 214

原创 WeClaw_39_远程桥接并发控制:MCP架构与Session隔离机制

想构建安全可靠的 AI Agent 工具调用系统?本文带你深入 WeClaw MCP 架构设计,通过 Session 隔离与并发控制机制,解决远程桥接难题。从协议原理到连接池管理,助你打造高可用的工具扩展方案 🔧。

2026-03-28 08:33:31 233

原创 WeClaw_38_CFTA异步调用链优化:从阻塞15秒到非阻塞并发

面对 AI 工具调用阻塞 15 秒的痛点,你是否渴望极致的响应速度?这篇文章将带你深入 WeClaw CFTA 架构,利用异步解耦与事件驱动技术,将阻塞等待转化为即时响应。你将掌握从架构设计到并发控制的实战经验,彻底告别 UI 卡顿!🚀

2026-03-28 08:22:35 403

原创 揭秘高效开发背后的底层逻辑:如何用技术思维解决复杂难题?

告别盲目试错,掌握高效开发的底层逻辑!本文带你通过抽象、分治等维度构建技术思维,直击复杂难题本质。让你跳出代码细节,像架构师一样思考,写出更优雅、易维护的代码 🚀。

2026-03-28 00:58:44 373

AI大模型辅助的数据分析应用开发示例CSV文件

《AI大模型应知应会100篇》第69篇:AI大模型辅助的数据分析应用开发示例CSV文件

2025-09-08

厦门大学解析:大模型技术及其应用实践全貌

内容概要:本文由厦门大学副教授林子雨撰写,详细介绍了大模型概念、发展历程及其在各大领域的应用。从图灵测试、人工智能的发展简史开始,阐述了大模型的概念与发展阶段,特别是萌芽期(1950-2005)、沉淀期(2006-2019)、爆发期(2020-今)。文中列举了国内外典型的大模型产品如ChatGPT、DeepSeek、Sora等,并详述了大模型在自然语言处理、计算机视觉、语音识别等领域的应用。此外,文章还讨论了AIGC的应用实践,例如文本生成、图像生成、视频生成,以及在辅助编程、搜索和智能办公中的表现。最终展望了大模型对未来工作生活和社会带来的深远影响。 适用人群:适合关注人工智能和大模型技术的专业人士和爱好者阅读。 使用场景及目标:帮助读者深入了解大模型技术的原理及其在各个领域的实际应用;指导企业和开发者选择和应用适当的大模型以优化业务流程或创新产品。 其他说明:文末提供了具体的案例实操,如使用DeepSeek进行对话、讯飞智文生成PPT、文心一格制作图画,为初学者提供了实践指导。

2025-03-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除