人工智能学习
文章平均质量分 93
后台开发拾遗
分享一些后台开发和架构设计的心得
展开
-
李宏毅ML2022 Spring HW3解析
因为作业不能采用预训练的模型,我尝试了ResNet18,发现要训练的次数比一般自己拼凑的CNN要多得多,计算资源都不太够了,最后用cross validation只训练了3个模型,都跑了600 epochs。我加的都是Random的变换,因为每次获取训练数据的时候,都是把所有的变换操作都执行一遍的,如果不是随机变换,那原图就永远不会参与训练,只有转换以后的图片才会参与训练,那训练效果可能就不好了。TTA是在test阶段的数据增强,即在预测的时候将原图变换出来的多张图片分别进行分类,再综合分类结果的方法。原创 2024-01-22 12:05:50 · 1223 阅读 · 1 评论 -
Pytorch view函数报错解决
这些操作其实没有改变数据在内存中存储的顺序,它们只是修改了Tensor的元数据,例如前面的3*4的Tensor调用transpose()转置后,会变成4*3的Tensor,但是底层的存储还是同一份,只是把stride改成(1, 4)了。简单地说,tensor的数据其实是按行优先的方式存储为1维的连续空间的,这跟我们学习的数组是类似的,以下是3*4的tensor a,底层存储在一行。有详细的解释,一句话就是因为性能问题,CPU读取连续的一行数据是非常快速的,但是如果读取不连续的一行数据就要做多次的IO。原创 2024-01-19 18:35:21 · 1719 阅读 · 1 评论