- 博客(8)
- 收藏
- 关注
原创 CUDA 12.8和PyTorch 2.8安装detectron2
尝试用--no-build-isolation选项,conda环境XXX替换自己的环境名称。
2026-03-04 21:16:07
14
原创 .view和.reshape区别
view()是“相信你自己没犯错的低层操作”,.reshape()是“PyTorch 帮你兜底的安全版本”。在你这种MANO / 3D→2D / pose 网络里,99% 的情况都应该用.reshape()或直接 broadcast,而不是.view()。
2026-01-19 14:42:51
320
转载 epoch、batch、batch size、step、iteration深度学习名词含义介绍
在神经网络的训练过程中,训练数据往往是很多的,比如几万条甚至几十万条——如果我们一次性将这上万条的数据全部放入模型,对计算机性能、神经网络模型学习能力等的要求太高了;个样本在神经网络研究中肯定不算大,但是我们这里只是一个例子,大家理解即可),因此我们希望将其分为多个。中,训练算法会按照设定的顺序将所有样本输入模型进行前向传播、计算损失、反向传播和参数更新。前面提到了,我们在神经网络训练过程中,往往需要将训练数据划分为多个。当然,在某些情况下,)的情况,而一般情况下我们肯定是需要训练多次的,也就是多个。
2026-01-19 09:57:20
53
原创 知识蒸馏基础知识:信息熵(Entropy)、交叉熵(Cross Entropy)、KL 散度(Kullback–Leibler Divergence)
随机变量服从分布 q 时,结果本身的不确定性只和 (q) 有关与模型无关用分布 p 去“解释/编码”来自 q 的数据,需要付出的平均代价依赖 (q) 和 (p)是训练中常用的损失函数分布 q 和分布 p 之间的差异程度衡量“像不像”不是距离(不对称)👉交叉熵 = KL 散度信息熵:世界本来有多不确定交叉熵:模型解释世界有多吃力KL 散度:模型和世界差多远。
2026-01-18 16:37:10
287
原创 ubuntu24.04 安装搜狗输入法教程
之前装了fcitx5,感觉不好用,记忆方面用起来不顺手。所以打算安装搜狗输入法。看了全网,还没有完整的教程,所以整理了一下内容,给大家分享。应该是初始的时候安装了fcitx5,但是和搜狗现有的冲突(搜狗支持fcitx4),需要把fcitx5全都卸载。正确结果应为:没有任何输出。或只剩下无关的库(一般不会)卸载的指令:①完整卸载 fcitx5(推荐做法)下面的代码需要逐行复制粘贴,按照视频来。2.安装搜狗输入法以及依赖项(参考视频。②确认是否卸干净(很重要)
2026-01-05 16:00:50
445
原创 远程连接服务器重新加载环境出现conda: command not found
linux远程root@ai:~# conda config --show -bash: conda: command not found。后,系统会修改你的 shell 配置文件(如。以下均为root@ai:~# 终端输入。为了使更改生效,你需要。
2025-08-27 20:32:42
293
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅