- 博客(22)
- 收藏
- 关注
原创 稀疏大模型(MoE架构)的颠覆性工作——Switch Transformers论文精读
摘要:本文探讨了MoE(混合专家)架构在大模型发展中的关键作用,重点分析了SwitchTransformer论文的创新点。该论文通过简化MoE路由机制,提出仅激活单个专家的top-1路由策略,在保持计算量不变的前提下显著提升了模型性能。实验表明,SwitchTransformer在相同计算资源下可获得7倍预训练加速,并首次实现了万亿参数模型的稳定训练。同时,文章还讨论了DeepSeek最新提出的Engram模块,该模块通过引入记忆机制来优化Transformer架构。这些技术突破共同推动了大模型向更高效、更
2026-01-19 10:59:14
1464
原创 数据结构基础理论(基于Python)
本文概述了八种常见数据结构的基本概念、特点及操作。Set集合存储唯一元素,基于哈希表实现;Array数组适合快速访问但修改效率低;LinkedList链表适合频繁增删;HashTable通过键值对实现高效查询;Queue队列遵循先进先出原则;Stack栈采用后进先出方式;Heap堆用于快速获取最值;Tree树具有层次结构,二叉树是重要特例。每种结构都详细说明了定义、时间复杂度特征和基本操作方法,为数据结构选择提供了实用参考。
2026-01-11 23:23:31
1130
原创 基于Unity开发的大件货物智慧运输与仿真系统(数字孪生系统)
本研究旨在开发基于多源数据融合的智慧运输决策支持系统。针对大件货物运输中涉及的复杂场景与动态环境,通过无人机航摄影像、GNSS定位数据及传感器信息,构建港口全域高精度三维数字模型,并结合YOLO目标检测与OCC占用感知技术,实现对船舶、特种车辆及货物的实时监控与精准定位。系统将综合考虑道路状况、货物特性及外部环境因素,降低运输时间与能耗,同时通过风险预警机制有效减少安全事故的发生概率。
2025-11-07 11:41:39
1258
原创 LeetCode算法刷题——滑动窗口
(如元素和、字符频次、是否满足条件等),从而避免暴力枚举所有子数组,达到优化时间复杂度的目的。减少while循环、降低时间复杂度、避免重复计算、处理连续性约束等。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!表示),在数组或字符串上。,目的是为了考察对于。,目的是为了考察对于。
2026-01-22 10:33:24
144
原创 LeetCode算法刷题——二分查找法
时间复杂度:O(logn),空间复杂度:迭代实现:O(1);递归实现:O(logn)中,通过不断将搜索区间对半缩小,从而高效查找目标值的算法。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!,每次将搜索空间减半,从而实现对数时间复杂度的查找。(Binary Search)是一种在。,目的是为了考察对于。,目的是为了考察对于。,目的是为了考察对于。
2026-01-20 11:46:47
168
原创 LeetCode算法刷题——双指针
双指针算法是一种在数组、链表或其他线性数据结构上使用两个“指针”(通常是索引或引用)协同遍历,以高效解决问题的算法技巧。这里的“指针”不一定是指 C/C++ 中的内存指针,更多是指数组下标或迭代器。通过维护两个指针(如左指针 left 和右指针 right),根据问题的性质动态地移动它们,从而避免使用嵌套循环,将时间复杂度从 O(n²)优化到O(n)。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!的运用,本题运用的方法为。
2026-01-13 14:30:27
239
原创 LeetCode刷题记录—[692]前K个高频单词
本题为中等题,目的是为了考察对于哈希表(HashTable)堆(Heap)的运用(数据结构)。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!
2026-01-09 13:01:19
208
原创 LeetCode刷题记录—[215]数组中的第K个最大元素
本题为中等题,目的是为了考察对于堆(Heap)的运用(数据结构)。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!
2026-01-09 10:28:48
162
原创 LeetCode刷题记录—[496]下一个更大元素 I
本题为简单题,目的是为了考察对于哈希表(HashTable)和栈(stack)的运用(数据结构)。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!
2026-01-07 10:50:45
209
原创 LeetCode刷题记录—[389]找不同
本题为简单题,目的是为了考察对于哈希表(HashTable)的理解(数据结构)。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!代码解析(python):涉及到ASCII字符编码。
2026-01-06 14:10:22
154
原创 LeetCode刷题记录—[217]存在重复元素
本题为简单题,目的是为了考察对于哈希表(HashTable)的理解(数据结构)。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!
2025-12-30 11:16:36
190
原创 CLIP:《Learning Transferable Visual Models From Natural Language Supervision》论文精读
SOTA计算机视觉系统被训练来预测一组固定的预定对象类别。这种受限的监督形式限制了它们的通用性和适用性,因为需要额外的标记数据来指定任何其他视觉概念。直接从有关图像的原始文本中学习是一个很有希望的替代方案,它利用了更广泛的监督来源。作者证明了用一个非常简单的预训练任务就可以非常高效的且可扩展的去学习一些最好的图像表征,其中这个任务就是给定一些图片和一些句子,模型需要去判断哪一个句子(标题)与哪一个图像是配对的。
2025-12-29 01:22:05
495
原创 LeetCode刷题记录—[20]有效的括号
本题为简单题,目的是为了考察对于Stack(栈)的理解(数据结构)。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!
2025-12-25 11:39:50
212
原创 LeetCode刷题记录—[933]最近请求次数
本题为简单题,目的是为了考察对于Queue(队列)的理解(数据结构)。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!
2025-12-23 14:43:56
184
原创 LeetCode刷题记录—[206]反转链表
本题为简单题,目的是为了考察对于LinkedList链表的理解(数据结构)。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!
2025-12-09 11:50:54
225
原创 LeetCode刷题记录—[203]移除链表元素
本题为简单题,目的是为了考察对于LinkedList链表的理解(数据结构)。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!
2025-12-08 11:11:21
180
原创 LeetCode刷题记录—[27]移动元素
注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!本题为简单题,目的是为了考察对于。数组的理解(数据结构)。
2025-12-04 16:07:02
144
原创 LeetCode刷题记录—[283]移动零
注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!本题为简单题,目的是为了考察对于。数组的理解(数据结构)。
2025-12-04 16:03:55
112
原创 LeetCode刷题记录—[485]最大连续 1 的个数
本题为简单题,目的是为了考察对于Array数组的理解(数据结构)。注:以下解法仅代表个人观点,并非唯一解法,仅供记录与参考!
2025-12-03 15:33:18
176
原创 单视图场景重建《Wonderland: Navigating 3D Scenes from a Single Image》论文精读
本文解决了一个具有挑战性的问题:如何能够高效地从单一任意图像创建高质量、宽范围的3D场景?现有方法面临多个限制,例如需要多视图数据、耗时的逐场景优化、背景视觉质量低以及未见区域的重建失真。本文提出了一种新颖的Pipeline来克服这些限制。具体而言,本文引入了一个大型重建模型,该模型利用来自相机引导视频扩散模型的潜在空间,以前馈方式预测场景的3D高斯泼溅(3D Gaussian Splatting)。
2025-12-02 10:22:40
759
原创 残差扩散模型《Residual Denoising Diffusion Models》论文精读
本文提出了一种新的残差去噪扩散模型(),它通过将传统的单一去噪扩散过程解耦为残差扩散和噪声扩散这两个过程,构建了一个双重扩散框架。这一框架将去噪型扩散模型从原本难以解释的图像修复任务扩展为一种统一且可解释的模型,用于图像生成和图像修复。具体来说,残差扩散表示从目标图像向退化图像的方向扩散,并在逆向生成过程中明确指导图像修复的过程。而噪声扩散则表示扩散过程中存在的随机扰动。残差部分优先处理“确定性”信息,而噪声部分则强调“多样性”,使得RDDM能够有效统一不同任务,例如图像生成(注重多样性)和。
2025-11-22 23:22:36
577
原创 VSCode远程连接服务器方法(保姆级带图教程)
⑤输入SSH服务器编号与地址后点击enter回车键:一般为ssh-L *******⑦选择开发环境:一般为Linux(根据情况自行选择)②安装好之后点击左下角“><”方块,打开远程连接!之后需要IDE远程连接,编译代码进行的说明!⑨已经成功连接服务器,可以开始运行代码了!⑥选择配置文件:默认即可。
2025-11-17 12:04:24
334
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅