深度学习中的数据预处理

最新推荐文章于 2024-04-18 15:39:07 发布

像我一样就刚好

最新推荐文章于 2024-04-18 15:39:07 发布

阅读量3k

点赞数

分类专栏：机器学习深度学习文章标签：数据预处理

本文链接：https://blog.csdn.net/Tyrannosar/article/details/79497794

版权

8 篇文章 1 订阅

订阅专栏

7 篇文章 1 订阅

订阅专栏

1.归一化

当多个特征的参数值数量级差异过大时，容易增加计算成本，需要对数据做归一化处理。最常用的归一化方法为，取数据集与其均值的差，再除以其标准差，使数据集拥有一个单位标准差，方便处理。

mean = train_data.mean(axis=0)
train_data -= mean
std = train_data.std(axis=0)
train_data /= std

test_data -= mean
test_data /= std

多分类问题的标签有两种编码方式：

第一种是使用独热编码的方式，将标签扩展为 n 维向量（n为类别数），对应哪一类哪一位数据就为 1，其余为 0。需选择 categorical_crossentropy 作为损失函数。

第二种是使用整型数据直接作为其标签，那么就要使用 sparse_categorical_crossentropy 作为损失函数。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注