- 博客(5)
- 收藏
- 关注
原创 知识蒸馏的简单理解
知识蒸馏是通过构建一个轻量化的小模型,利用性能更好的大模型的监督信息,来训练这个小模型大模型: Teacher model 小模型:Student modelTeacher model 输出的知识(knowledge) Student model 学习来自Teacher的监督的信息的过程–> Distillation(蒸馏)
2023-12-07 09:40:43 425
原创 RuntimeError: No CUDA GPUs are available问题解决
本地在调试机上跑没问题,但是上传到服务器上正是跑出现问题,出现如下报错。调试机上有4块GPU资源,但是正式提交平台后单卡训练。修改为“0”,”1“ ,问题解决!
2023-11-24 14:02:52 1314 1
原创 代码随想录刷题第二天--链表专题
这个题目在第一次做的时候没有想到最优解,但是后来思考了一下,其实对于链表来说,就是各个指针的变换,所以对于节点交换来说也不例外,只是说这里需要处理的节点数比较多。本题需要删除到对应链表中值为val的所有元素,首先需要注意的是删除元素时为了不再特殊处理第一个元素(由于第一个元素没有前驱节点),所以此处引入一个新的头节点,以下进行处理时便都是一样的操作了。之后仔细观察了一下,其实是在删除节点之后是不需要移动节点的,只有是该节点不需要删除时才进行指针移动,这样便解决了问题。
2023-07-25 19:13:14 30
原创 代码随想录刷题第一天--数组专题
对于二分查找来说,比较用于出错的地方在于要注意循环变量的不变性;具体来说就是在对于区间进行比较时采用左闭右闭的形式来写:eg[left,right]链接: [link](https://leetcode.cn/problems/binary-search/)这里注意的是while(i<=j),由于采用的左闭右闭的形式,所以i==j的情况下也是有效的,也需要进行循环。
2023-07-24 22:37:30 53
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人