看源代码时候遇到的问题
以前没有什么项目经历,所以现在每次看源代码就头痛得要死。
Q1:项目源代码里面的.yml文件是什么?
这个文件的介绍网友已经写得很仔细了,我就不搬运了,参考:https://zhuanlan.zhihu.com/p/433176170
transformer源代码仓库链接
把源代码贴在这里便于查找:
https://github.com/harvardnlp/annotated-transformer
哈佛大学团队实现的pytorch版本。
一位大佬的该源码讲解:
https://zhuanlan.zhihu.com/p/398039366
另一个源代码版本
其实我之前看的源代码是另一个版本,这里也贴在这里,我刚刚克隆下来,还没有仔细看
:https://github.com/OpenNMT/OpenNMT-py
这里目录也太复杂了,本菜鸟实在不明白每个部分是干啥的,有大佬路过愿意指点一二的话,本人感激不尽。如图:
查看cuda版本的命令(服了我自己,每次都忘记)
conda list
查看pytorch与python等的对应版本
https://blog.csdn.net/shiwanghualuo/article/details/122860521
uniform_()函数解析
博主已经说得很清楚,我不搬运了,参考:
https://blog.csdn.net/qq_39665216/article/details/126217031
xavier_函数
以下内容来源于:https://blog.csdn.net/dss_dssssd/article/details/83959474
深度学习模型混合精度训练
这个我也不太懂,救命,我项目都没怎么跑过呀,研一导师放养过得可快乐了,现在啥也不会。
现在导师还是放养,该如何自救啊!!!大佬路过指点一下,感激不尽!!!
混合精度训练,参考下面的文章:
https://zhuanlan.zhihu.com/p/103685761
这个源代码太复杂了
我放弃了,这个源代码对我来说太复杂了,我决定先看看哈佛团队的。