google搜索是个好东西,stack overflow同样很好
学会中文搜不到的用英文搜
定义模型的时候,发现用x.clamp(min = 0)
和F.relu(x)
得到的损失结果不一样,经查证:虽然激活函数ReLu
是连续的,但是在自变量等于零的时候,ReLu
不可导,x=0时,clamp选择导数为1,而ReLu选择导数为0
google搜索是个好东西,stack overflow同样很好
学会中文搜不到的用英文搜
定义模型的时候,发现用x.clamp(min = 0)
和F.relu(x)
得到的损失结果不一样,经查证:虽然激活函数ReLu
是连续的,但是在自变量等于零的时候,ReLu
不可导,x=0时,clamp选择导数为1,而ReLu选择导数为0