Dxdiag可以显示计算机上DirectX相关的文件,检查正在运行的文件、输入设备、以及视频驱动程序版本。还可以用来诊断和测试 DirectPlay、 DirectSound、 DirectMusic、 DirectDraw 和 Direct3D 的功能。
启动jupyter notebook就在anaconda的命令窗口中键入jupyter notebook就行,环境以及搭好了,注意这个notebook所在的路径是终端的目录,如果和d2l的目录不一样需要用cd跳转(或者这里最好cd 到 d2l-zh 所在目录下运行 notebook)
python中关于sum()函数中的参数axis=i的理解,若一个三维矩阵为(2,2,2),内容为[[[1,1],[2,2]],[[3,3],[4,4]]],若axis=0,可以这么理解:axis=0为深度维,第0维,目光正视深度层并压下去,降一个维度,即从上往下看压扁成为二维矩阵。同理axis=1时,维长度维,第1维,从正面看去并压扁求和,也得到二维矩阵。同理axis=2则从宽度层第3维,正视侧面并压扁求和。若按axis求和过程中不想把该维度丢掉,则可以使用参数keepdims,True时则该维度保留为1。
TensorDataset描述如下
一文搞懂网络训练中一个epoch中到底做了什么+zero_grad可以放在backward后面吗(train.py)
https://blog.csdn.net/qq_43369406/article/details/129740629
对于多模态大模型而言,视觉问答能力(VQA)是其最基础且关键的能力之一
Visual Dialog视觉对话
Matterport3D是一个非常好的3D的RGB-D数据集,可以用在很多相关领域。Vision-and-Language Navigation问题使用的R2R数据集就是依托于matterport3D制作的。