自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 收藏
  • 关注

原创 CUDA安装版本出现驱动mismatch问题

nvidia指令调用与NVML版本不匹配问题。

2024-09-14 10:40:24 269

原创 【贪心算法】Dijkstra 算法及其衍生

Dijkstra 算法学习摘录

2024-01-06 16:23:05 1814

原创 【NP】规约与问题复杂度

规约和算法复杂问题

2024-01-04 16:02:35 668

原创 【网络流】最大流与Ford–Fulkerson算法

Ford-Fulkerson 算法笔记

2024-01-03 14:30:38 2394

原创 【进化算法】遗传与基因

或者说进化算法是仿照生物进化过程,按照优胜劣汰的自然选择优化的规律和方法,来解决科学研究、工程技术及管理等领域用传统的优化方法难以解决的优化问题。它是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型,其目的:一是抽取和解释自然系统的自适应过程;遗传算法能够应用于各种优化问题,如工程优化、调度问题、机器学习中的超参数优化、函数优化、组合优化、生产调度问题、自动控制、机器人学图像处理、多机器人路径规划等领域。控制生物遗传的物质单位称为基因,因此,遗传算法是在基因的水平上模拟生物的进化行为。

2024-01-02 20:11:35 1552

原创 【组合数学】Pólya 计数理论

Pólya 计数理论与Burnside 引理介绍及应用。

2023-12-22 15:11:07 2439

原创 【组合数学】生成函数

生成函数要点摘录

2023-12-19 22:25:25 1514

原创 【组合数学】递推关系

递推关系;常系数齐次递推关系的求解;常系数非齐次递推关系的求解

2023-12-11 22:06:50 2569

原创 LIMoE:使用MoE学习多个模态

文章提出了第一个使用MoE组合的大规模多模式架构 LIMoE。 使用稀疏激活的自然专家同时处理图像和文本。

2023-12-09 17:26:51 3691

原创 【组合数学】容斥&鸽巢原理

组合数学容斥原理

2023-12-05 12:44:33 4272

原创 【组合数学】排列组合

组合数学知识点梳理

2023-12-04 21:58:51 3843

原创 【动态规划】求最长递增子序列问题

最长递增子序列,力扣算法第300题

2023-11-28 21:17:32 8273

原创 【RLChina2023】CCF 苏州 记录

本博客记录了本人2023年11月24-26日为期三天的RLChina会议收获,文章只做简单记录,如有侵权联系作者会立刻删除。

2023-11-27 21:51:42 9276

原创 【智能优化算法】从蚁群到动物园

人们从自然界的多种生物、昆虫、动物、植物等的生存、繁衍过程以及自然现象、水循环、生态平衡等过程中,发现了其中蕴含着大量的信息处理的优化机制和机理。于是人们从模拟这些优化机制、优化机理出发,提出了数以百计的不依赖被优化问题数学模型的优化算法。

2023-11-21 21:59:28 12938

原创 【动态规划】求解编辑距离问题

编辑距离问题是求解将⼀个字符串转换为另⼀个字符串所需的插⼊、删除、替换的最小次数。

2023-11-18 17:44:20 11971

原创 【L2GD】: 无环局部梯度下降

本文主要摘录无环路局部梯度下降(L2GD)、L2GD的收敛理论以及对局部步骤在联邦学习中的作用的见解。

2023-11-16 22:38:28 904

原创 FLMix: 联邦学习新范式——局部和全局的结合

本博客从`优化函数`角度出发,学习传统联邦学习和新型联邦学习的差异。

2023-11-16 16:27:18 12284

原创 【图】:常用图搜索(图遍历)算法

总结罗列常用图遍历和图搜索算法。

2023-11-05 12:56:23 16080 1

原创 【数据结构】树家族

当谈到数据结构中的树时,我们通常指的是一种分层的数据结构,本问主要介绍树家族的典型成员。

2023-11-03 11:23:52 15787

原创 【动态规划】“以宇换宙”的优雅工艺

动态规划:“以宇换宙”的优雅工艺

2023-11-02 17:31:56 15677

原创 FedAT:分层机制更新的联邦学习

联邦学习(FL)涉及在大规模分布式设备上训练模型,同时保持本地训练数据私有化。这种形式的协作学习需要考虑模型的收敛速度,准确性,客户端之间平衡问题和通信成本多方面的新权衡。

2023-11-01 22:31:39 11148

原创 分治法求解多项式乘法

传统的多项式乘法采用暴力求解的复杂度为 O(n^2),本文探讨了一种基于快速傅里叶变换并且复杂度为 O(nlogn)的求解方法

2023-10-30 23:58:28 11057

原创 主定理(一般式)

主定理(Master Theorem)是用于分析递归算法时间复杂度的一个重要工具。它适用于形式化定义的一类递归关系,通常采用分治策略解决问题的情况。

2023-10-29 22:47:14 14346

原创 【笔录】TVP技术沙龙:寻宝AI时代

大模型是10倍的机会,但并不是平均主义的机会,没有低垂的果实。企业想在大模型的赛道上跑出成绩,应该怎么做,又要选择哪些赛道?

2023-10-28 22:27:57 11156

原创 AI 编程与研发效能论坛 笔记摘录

1024程序员节 AI编程与研发效能论坛 笔记摘录

2023-10-24 20:20:07 9410

原创 Janus: Data-Centric MoE 通讯成本分析(2)

在之前的blog中,我们学习了Janus的理论基础和模型搭建。通过以数据为中心的范式思路和巧妙的读取测略,Janus极大的减少了算法的通讯成本。本篇blog将从数学的角度定量解读Janus是如何降低通讯开销的。

2023-10-23 21:25:36 10208

原创 【实用技巧】Latex写算法伪代码(格式篇)

latex写算法伪代码如何进行 缩进 换行 换页

2023-10-20 21:58:37 13277 3

原创 Janus: 逆向思维,以数据为中心的MoE训练范式(1)

常见的MoE架构都以专家为中心,通过将专家保留在合适的位置,并交换中间数据以满足专家的需求。那么如果调换一下专家和数据的位置关系,会有什么神奇的现象发生呢?基于这个猜想,诞生了Janus以数据为中心范式——保持数据在适当的位置,并在gpu之间移动专家。这个猜想的合理处在于,如果专家的规模小于数据规模,那么以数据为中心的范式可以减少交流的工作量。

2023-10-20 21:25:25 10973 1

原创 MMoE: 基于多门专家混合的多任务学习任务关系建模

Multi-task Learning with Multi-gate Mixture-of-Experts

2023-10-19 20:54:18 13040

原创 主定理(简化版)

主定理(Master Theorem)是用于分析递归算法时间复杂度的一个重要工具。

2023-10-17 23:16:42 13328

原创 PFL-MoE:基于混合专家的个性联邦学习

PEL-MoE:基于专家混合的个性化联合学习

2023-10-17 22:17:23 13045

原创 分治算法求解凸包问题

课堂记录,分治法解决凸包问题。

2023-10-11 21:16:42 10261 5

原创 Single-gated MoE : CV领域MoE模型应用

大规模MoE条件模型的成功引发了这样一个问题:对于规模更小的数据集和架构,是否也可以得到类似的结果?本文建议人们重新审视简单的单门混合专家模型,因为它允许人们进行更多的实践训练。

2023-10-11 20:24:32 8835

原创 创作第512天

我是一个很喜欢分享的人,我觉得技术就是共享的,你分享你的技术点给我,我分享我的技术点给你,那么就是1 + 1 > 2的效果。在进入研究生阶段,我打算用博客的方式记录我的科研路程。

2023-10-09 10:13:40 11611 1

原创 【贪心算法】经典案例分析2

贪心算法在每一步选择中都采取当前状态下最优的选择,以期望达到全局最优解。

2023-10-08 20:27:06 12588

原创 【实用技巧】Latex写算法伪代码(pseudocode)

使用latex编写算法pseudocode

2023-10-08 20:11:37 15346 1

原创 SE-MoE:可拓展分布式MoE训练及推理框架(百度)

百度团队提出了一个新的混合专家(MoE)模型的训练和推理框架:SE-MoE。文章解决了MoE模型在计算、通信和存储方面的挑战和局限性。

2023-10-08 18:25:22 14324 1

原创 HET: 基于缓存的分布式可扩展大型嵌入模型训练

现有的分布式训练框架面临着嵌入模型的可扩展性问题,因为从服务器更新和检索共享的嵌入参数通常占训练周期的主导地位。如何克服通信导致的高成本瓶颈,HET给出了它的答案。

2023-10-07 22:12:05 13575 1

原创 【实用技巧】Markdown转PDF

md2pdf

2023-10-07 19:20:29 13805 1

原创 Learning@home:大模型分布式训练范式

如何在不可靠的硬件上训练大型神经网络。作者提出了这样一个希冀:研究人员和实践者将能够联合起来,共同解决最大的问题,而不是进行孤立的实验。大模型训练不再局限于一台超级计算机,而是随着世界各地越来越多的人和组织的加入,自然增长。

2023-10-06 16:34:16 16918 1

组合原理及其应用课后习题参考答案

苏州大学计算机数学教材 组合原理及其应用课后习题参考答案

2023-09-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除