Task1

Kikyou247377

于 2020-02-13 15:37:47 发布

阅读量192

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangzhenzhangz/article/details/104296381

版权

线性回归

用来预测标签的因素称为特征
过程分为：获取&读取数据确定模型&模型参数损失函数优化算法训练模型
绝大多数深度学习模型也是采用类似步骤

$A\odot B$ 被称为Hadamard积，其结果为元素按索引相乘

两个用张量做索引取值的函数：
torch.gather(input, dim, index)
把input内容按index进行聚合 output形状同index
torch.scatter(input, dim, index, src)
把input内容按index用src进行替换 output形状同input
取值逻辑如下

Softmax

对应之前Linear Regression的连续输出，使用softmax运算符来进行离散输出
$\hat{y}_{1},\hat{y}_{2},\hat{y}_{3} = \textup{softmax}(o_{1},o_{2},o_{3})$ ，其中 $\hat{y}_{i}=\frac{exp(o_{i})}{\sum_{i}exp(o_{i})}$
softmax将连续的样本特征转化为离散的分类类别概率分布

交叉熵用来衡量两个概率分布之间的差异
$H(y^{(i)},\hat{y}^{(i)})=-\sum_{j=1}^{q} y^{(i)}_{j}\textup{log} \hat{y}^{(i)}_{j}$
交叉熵更关心预测正确的概率类别

对于个数为n的样本，基于交叉熵的损失函数为
$l(\Theta )=\frac{1}{n}\sum_{i=1}^{n}H(y^{(i)},\hat{y}^{(i)})$

softmax回归是一个单层的神经网络

多层感知机

常用激活函数有ReLU，sigmoid，tanh
ReLU计算少，sigmoid和tanh计算多，故在层数多时，最好有ReLU
ReLU只能在隐藏层使用
可先试ReLU，效果不好时再尝试其它的

反向传播算法的目的是最小化一个可导的损失函数

广播机制：
y_hat的形状是[n, 1]
y的形状是[n]
两者直接相减结果是[n, n]
注意共用内存问题。即使共用内存，也不是同一个张量，因为张量还有其它属性

另有一个属性问题：
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Task1

线性回归用来预测标签的因素称为特征过程分为：获取&读取数据确定模型&模型参数损失函数优化算法训练模型绝大多数深度学习模型也是采用类似步骤A⊙BA\odot BA⊙B被称为Hadamard积，其结果为元素按索引相乘两个用张量做索引取值的函数：torch.gather(input, dim, index)把input内容按index进行聚合 output形状同i...
复制链接

扫一扫

Kikyou247377 CSDN认证博客专家 CSDN认证企业博客

码龄8年

9: 原创

37万+: 周排名

157万+: 总排名

931: 访问

: 等级

91: 积分

0: 粉丝

0: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。