- 博客(49)
- 收藏
- 关注
原创 混合专家模型(MoE)
混合专家模型(MoE)是一种提升大语言模型性能的技术,通过多个子模型(专家)和路由机制动态选择最适合的专家处理输入。MoE用稀疏层替代传统密集层,仅激活部分参数,提升推理效率。路由机制通过softmax概率分配输入到专家,并引入负载均衡策略(如KeepTopK、容量限制)确保专家均衡训练。该技术也可应用于视觉模型,处理图像块时通过优先级评分优化资源分配。MoE在保持模型质量的同时显著降低计算开销,为多模态模型发展提供重要思路。(来自AI)
2025-06-30 02:16:57
841
原创 尚硅谷spring框架视频教程——学习笔记二(数据库、事务、webflux)
如果我们开启了事务,会注册一个BeanPostProcesser(bean后置处理器)的实现类到容器中, 这个BeanPostProcesser会在postProcessAfterInitialization方法中使用代理类来偷梁换柱真正的bean。典型事务场景——银行转账:一个账户的钱增加,另一个账户的钱减少,这两个操作要么都成功,要么都失败。另外还需要注意,事务涉及的操作要尽可能的少,避免大事务,否则可能会引起数据库连接池占满、接口超时、回滚时间长等问题。(1)不考虑事务之间的相互影响会导致的问题。
2025-02-06 00:20:37
1129
原创 vue事件总线(原理、优缺点)
对于第一个要求,Vue通过内置关系VueComponent.prototype.__proto__ === Vue.prototype,使组件实例对象可以访问到Vue原型上的属性和方法,所以只需把事件总线放在Vue的原型对象上,它就可以被所有组件访问。至于第二个要求,Vue在原型对象上定义了$on、$emit、$off等方法,用于实现事件监听。源码位置:https://github.com/vuejs/vue/blob/main/src/core/instance/events.ts。
2025-01-27 22:49:04
1558
原创 SeFa:Closed-Form Factorization of Latent Semantics in GANs笔记
对训练好的GAN的权重进行分解,使用无监督的方式控制图像的生成(脸的方向、眼睛的大小等)
2021-03-14 15:06:56
1427
1
原创 【深度之眼cs231n第七期】笔记(十七)
assignment2里的ConvolutionalNetworks(卷积神经网络)主要实现标准卷积层、最大池化层、空间批量归一化层
2020-05-29 12:02:40
682
1
原创 【深度之眼cs231n第七期】笔记(十五)
assignment2——BatchNormalization.ipynb和Dropout.ipynb
2020-05-08 11:36:10
592
1
原创 【深度之眼cs231n第七期】笔记(十四)
assignment2里的FullyConnedtedNets.ipynb中的后半部分——各种梯度下降方法
2020-05-04 13:42:05
524
1
原创 【深度之眼吴恩达机器学习第四期】笔记(三)
作业一(线性回归)和作业二(逻辑回归)ps:吐槽自己一句,其实原来的代码注释已经很详细了,真不知道自己写来干嘛。。。
2020-01-26 00:56:31
599
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅