恭仔さん-CSDN博客

原创 CUDA安装版本出现驱动mismatch问题

nvidia指令调用与NVML版本不匹配问题。

2024-09-14 10:40:24 484

原创【网络流】最大流与Ford–Fulkerson算法

Ford-Fulkerson 算法笔记

2024-01-03 14:30:38 2660

或者说进化算法是仿照生物进化过程，按照优胜劣汰的自然选择优化的规律和方法，来解决科学研究、工程技术及管理等领域用传统的优化方法难以解决的优化问题。它是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型，其目的：一是抽取和解释自然系统的自适应过程；遗传算法能够应用于各种优化问题，如工程优化、调度问题、机器学习中的超参数优化、函数优化、组合优化、生产调度问题、自动控制、机器人学图像处理、多机器人路径规划等领域。控制生物遗传的物质单位称为基因，因此，遗传算法是在基因的水平上模拟生物的进化行为。

2024-01-02 20:11:35 1712

原创【组合数学】Pólya 计数理论

Pólya 计数理论与Burnside 引理介绍及应用。

2023-12-22 15:11:07 3460

原创【组合数学】生成函数

生成函数要点摘录

2023-12-19 22:25:25 2026

原创【组合数学】递推关系

递推关系；常系数齐次递推关系的求解；常系数非齐次递推关系的求解

2023-12-11 22:06:50 2932

原创 LIMoE：使用MoE学习多个模态

文章提出了第一个使用MoE组合的大规模多模式架构 LIMoE。使用稀疏激活的自然专家同时处理图像和文本。

2023-12-09 17:26:51 4233

原创【组合数学】容斥&鸽巢原理

组合数学容斥原理

2023-12-05 12:44:33 4808

原创【组合数学】排列组合

组合数学知识点梳理

2023-12-04 21:58:51 4039

原创【动态规划】求最长递增子序列问题

最长递增子序列，力扣算法第300题

2023-11-28 21:17:32 8646

原创【RLChina2023】CCF 苏州记录

本博客记录了本人2023年11月24-26日为期三天的RLChina会议收获，文章只做简单记录，如有侵权联系作者会立刻删除。

2023-11-27 21:51:42 9370

原创【智能优化算法】从蚁群到动物园

人们从自然界的多种生物、昆虫、动物、植物等的生存、繁衍过程以及自然现象、水循环、生态平衡等过程中，发现了其中蕴含着大量的信息处理的优化机制和机理。于是人们从模拟这些优化机制、优化机理出发，提出了数以百计的不依赖被优化问题数学模型的优化算法。

2023-11-21 21:59:28 13859

原创【动态规划】求解编辑距离问题

编辑距离问题是求解将⼀个字符串转换为另⼀个字符串所需的插⼊、删除、替换的最小次数。

2023-11-18 17:44:20 12384

原创【L2GD】: 无环局部梯度下降

本文主要摘录无环路局部梯度下降(L2GD)、L2GD的收敛理论以及对局部步骤在联邦学习中的作用的见解。

2023-11-16 22:38:28 1026

原创 FLMix: 联邦学习新范式——局部和全局的结合

本博客从`优化函数`角度出发，学习传统联邦学习和新型联邦学习的差异。

2023-11-16 16:27:18 12555

原创【图】：常用图搜索（图遍历）算法

总结罗列常用图遍历和图搜索算法。

2023-11-05 12:56:23 16393 1

原创【数据结构】树家族

当谈到数据结构中的树时，我们通常指的是一种分层的数据结构，本问主要介绍树家族的典型成员。

2023-11-03 11:23:52 15913

原创【动态规划】“以宇换宙”的优雅工艺

动态规划：“以宇换宙”的优雅工艺

2023-11-02 17:31:56 15712

原创 FedAT：分层机制更新的联邦学习

联邦学习（FL）涉及在大规模分布式设备上训练模型，同时保持本地训练数据私有化。这种形式的协作学习需要考虑模型的收敛速度，准确性，客户端之间平衡问题和通信成本多方面的新权衡。

2023-11-01 22:31:39 11912

原创分治法求解多项式乘法

传统的多项式乘法采用暴力求解的复杂度为 O（n^2）,本文探讨了一种基于快速傅里叶变换并且复杂度为 O（nlogn）的求解方法

2023-10-30 23:58:28 11540

原创主定理（一般式）

主定理（Master Theorem）是用于分析递归算法时间复杂度的一个重要工具。它适用于形式化定义的一类递归关系，通常采用分治策略解决问题的情况。

2023-10-29 22:47:14 15823

原创【笔录】TVP技术沙龙：寻宝AI时代

大模型是10倍的机会，但并不是平均主义的机会，没有低垂的果实。企业想在大模型的赛道上跑出成绩，应该怎么做，又要选择哪些赛道？

2023-10-28 22:27:57 11203

原创 AI 编程与研发效能论坛笔记摘录

1024程序员节 AI编程与研发效能论坛笔记摘录

2023-10-24 20:20:07 9444

原创 Janus: Data-Centric MoE 通讯成本分析（2）

在之前的blog中，我们学习了Janus的理论基础和模型搭建。通过以数据为中心的范式思路和巧妙的读取测略，Janus极大的减少了算法的通讯成本。本篇blog将从数学的角度定量解读Janus是如何降低通讯开销的。

2023-10-23 21:25:36 10454

原创【实用技巧】Latex写算法伪代码（格式篇）

latex写算法伪代码如何进行缩进换行换页

2023-10-20 21:58:37 13954 3

原创 Janus: 逆向思维，以数据为中心的MoE训练范式（1）

常见的MoE架构都以专家为中心，通过将专家保留在合适的位置，并交换中间数据以满足专家的需求。那么如果调换一下专家和数据的位置关系，会有什么神奇的现象发生呢？基于这个猜想，诞生了Janus以数据为中心范式——保持数据在适当的位置，并在gpu之间移动专家。这个猜想的合理处在于，如果专家的规模小于数据规模，那么以数据为中心的范式可以减少交流的工作量。

2023-10-20 21:25:25 11278 1