deep learning with pytorch——9

区间值、序数值和分类值:
1.第一种是连续值。如果你用单位来计算或测量某物,这个值可能是一个连续的值。
2.接下来是序数值。连续值的严格顺序仍然存在,但值之间的固定关系不再适用。
3.最后,分类值既没有顺序也没有数字意义。只需要不同的值来区分它们。
在这里插入图片描述
选择除最后一行外的所有行和列。
选择所有行和的最后一列。
如果要转换标签张量中的目标张量,则有两个选项,具体取决于策略或使用分类数据的方式。一种选择是将标签视为分数的整数向量:

在这里插入图片描述如果目标是字符串标签(如葡萄酒颜色),则为每个字符串指定一个整数
另一种方法是建立分数的一个热编码,也就是说,将10个分数中的每一个编码成10个元素的向量,所有元素都设置为0,但每个分数有一个不同的索引。这样,得分1可以映射到向量(1,0,0,0,0,0,0,0,0,0,0,0,0),得分5到(0,0,0,1,0,0,0,0,0,0)等等。
通过使用scatter_u方法可以实现一种热编码,该方法使用源张量中的值沿作为参数提供的索引填充张量。
在这里插入图片描述、scatter的功能。首先,注意它的名字以下划线结尾。PyTorch中的这个约定表明该方法不会返回新的张量,而是在适当的位置修改张量。scatter的理由是:
scatter的第二个参数,索引张量,需要与你所分散到的张量具有相同的维数。由于target_onehot有两个维度(4898x10),您需要使用unsqueze向target添加一个额外的虚拟维度:
PyTorch允许您在训练神经网络时直接使用类索引作为目标。但是,如果你想把分数作为网络的分类输入,你就必须把它转换成一个热编码的张量。
现在回到数据张量,包含11个与化学分析相关的变量。可以使用PyTorch Tensor API中的函数以张量形式操作数据。首先,获得每列的平均值和标准偏差:
在这里插入图片描述

在这种情况下,dim=0表示沿尺寸0进行缩减。此时,您可以通过减去平均值并除以标准差来规范化数据,这有助于学习过程。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值