- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 Tranformer模型详解及源码阅读
详细介绍了transformer的各个模块,并思考各个模块为何这么设计。Position Encoding为什么是正余弦函数的形式?如何对位置进行编码?Position Encoding和Position Embedding的区别?为什么不乘以缩放因子容易落入梯度饱和区?
2024-05-23 22:14:45 1327
原创 记一次pyspark数据倾斜引起OOM的解决方案
记录了一次spark报错beyond the 'PHYSICAL' memory limit. Current usage: 11.0 GB of 11 GB physical memory used的解决过程,主要原因是数据倾斜,通过增加并行度的方式解决了数据倾斜问题
2023-05-08 22:00:32 586 1
原创 在个人PC上搭建jupyter服务并配置远程访问
为了成为一名优秀的炼丹师,最近配了台性能不错的主机,但苦于经常不在家,主机基本处于吃灰状态。因此,综合网上各种资料,在主机上安装jupyter并配置远程访问,能方便我随时随地远程使用。以下为配置教程,供大家参考。
2023-04-08 16:02:31 4972 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人