- 博客(5)
- 收藏
- 关注
转载 探秘Transformer系列之(33)--- DeepSeek MTP
MTP(Multi-token Prediction)的总体思路是:让模型使用n个独立的输出头来预测接下来的n个token,这n个独立的输出头共享同一个模型主干。这样通过解码阶段的优化,将1-token的生成,转变成multi-token的生成,从而提升训练和推理的性能。在DeepSeek之前也有几个MTP方案,其侧重点各自不同。侧重推理时解码加速。
2025-06-29 12:19:25
217
转载 ArkUI-X在Android上使用Fragment开发指南
本文介绍将ArkUI框架的UIAbility跨平台部署至Android平台Fragment的使用说明,实现Android原生Fragment和ArkUI跨平台Fragment的混合开发,方便开发者灵活部署跨平台界面。
2025-06-20 05:32:24
74
转载 iOS 如何键盘触发生成强密码
我整理的一些关于【iOS,代码示例,键盘事件】的项目学习资料(附讲解~~)和大家一起分享、学习一下:https://d.51cto.com/eDOcp1iOS 如何键盘触发生成强密码 在现代应用中,强密码的生成与管理变得越来越重要,尤其是在保护用户敏感信息方面。iOS 提供了一些便利的方法来帮助开发者生成强密码。本文将详...
2024-08-25 04:05:35
204
转载 Python自带的安装包有哪些
Python,安装相关视频讲解:python的or运算赋值用法用python编程Excel有没有用处?011_编程到底好玩在哪?查看python文件_输出py文件_cat_运行python文件_shelPython自带的安装包有哪些 Python是一种功能强大且易于学习的编程语言,它提供了丰富的标准库和第三方库,使得...
2024-07-08 02:53:08
305
转载 python 提取df最后一行最后一列单元格值
Python,开发者相关视频讲解:python的or运算赋值用法用python编程Excel有没有用处?011_编程到底好玩在哪?查看python文件_输出py文件_cat_运行python文件_shel提取DataFrame最后一行最后一列单元格值 作为一名经验丰富的开发者,你经常会遇到一些新手开发者向你请教一些基...
2024-07-06 03:02:08
641
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅