神经网络基础1：数据处理biasing与scaling

最新推荐文章于 2024-08-05 11:28:49 发布

yeqiustu

最新推荐文章于 2024-08-05 11:28:49 发布

阅读量1.6k

点赞数 3

分类专栏：神经网络基础文章标签：深度学习神经网络 biasing scaling

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yeqiustu/article/details/106172592

版权

本文探讨神经网络中数据预处理的重要性，包括scaling和biasing。通过对输入数据进行去量纲化的scaling操作，可以避免梯度更新的偏斜，提升收敛速度。biasing通过去中心化使数据具有正负值，缓解更新方向限制。然而，对于样本数据的biasing可能不适用于稀疏特征，因为它可能导致不必要的参数更新。

摘要由CSDN通过智能技术生成

数据处理

我们知道在神经网络中，通常需要对样本数据进行预处理（Z-score standardization）、对各层中间隐层进行normalization（如Batch-normalization、layer-normalization等），这些操作都涉及biasing和scaling操作，那为什么需要这些操作？

我们知道，每个神经元输出都是输入的线性组合z经过线性/非线性变换得到的

y=f(z)=f(b+W^TX)

可以把梯度理解成是输入对输出贡献的力度，梯度大小是与输入数值大小息息相关的 $\partial z / \partial W = X$ ，中间输出z对参数W的梯度等于输入向量X，而神经网络使用梯度下降法来训练更新参数W，也即参数W的更新大小与方向与输入向量X是线性的；

当输入向量X严重偏向某些维度时，参数W的更新同样也会严重偏向这些维度，也即会形成类似zig-zag形的更新路径，从而严重影响收敛速度，如下左图所示，为了避免这种情况，通常需要对数据进行scaling，对样本数据来说便是去量纲化。
另外，

最低0.47元/天解锁文章

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
神经网络基础1：数据处理biasing与scaling

数据处理我们知道在神经网络中，通常需要对样本数据进行预处理（Z-score standardization）、对各层中间隐层进行normalization（如Batch-normalization、layer-normalization等），这些操作都涉及biasing和scaling操作，那为什么需要这些操作？我们知道，每个神经元输出都是输入的线性组合z经过线性/非线性变换得到的可以把梯度理解成是输入对输出贡献的力度，梯度大小是与输入数值大小息息相关的，中间输出z对参数W的梯度等于输入向量
复制链接

扫一扫

专栏目录

yeqiustu CSDN认证博客专家 CSDN认证企业博客

码龄12年

30: 原创

13万+: 周排名

199万+: 总排名

8万+: 访问

: 等级

830: 积分

17: 粉丝

46: 获赞

13: 评论

135: 收藏

私信

关注

分类专栏

最新评论

tensorflow入门：TFRecordDataset变长数据的batch读取
cxrot: Traceback (most recent call last): File "/Users/xuan/PycharmProjects/pythonProject/test_tf_varlenfeat.py", line 70, in <module> test_varlen_feat() File "/Users/xuan/PycharmProjects/pythonProject/test_tf_varlenfeat.py", line 60, in test_varlen_feat make_varlen_dataset() File "/Users/xuan/PycharmProjects/pythonProject/test_tf_varlenfeat.py", line 31, in make_varlen_dataset random.shuffle(inx_lst) File "/usr/local/Cellar/python@3.7/3.7.9_2/Frameworks/Python.framework/Versions/3.7/lib/python3.7/random.py", line 278, in shuffle x[i], x[j] = x[j], x[i] TypeError: 'range' object does not support item assignment
tensorflow入门：TFRecordDataset变长数据的batch读取
kongjulvse: 为啥我这就显示 TypeError: Batching of padded sparse tensors is not currently supported
tensorflow入门：tf.name_scope，tf.variable_scope、变量共享
120斤: module 'tensorflow' has no attribute 'AUTO_REUSE'，，博主为什么我会出现这个错误？
tensorflow入门：tfrecord 和tf.data.TFRecordDataset
menghuanguaishou 回复 menghuanguaishou: 这教程写得太烂了，按你的一步步做根本理解不了，比如第一步dataset = tf.data.TFRecordDataset('xxx.tfrecord')，然后就feats = tf.parse_single_example(serial_exmp, features=data_dict)，dataset怎么变成的serial_exmp啊，怎么下面突然就使用serial_exmp了呢...,而你下面的全部代码中有很多没有解释的代码，下面的全部代码，太长了，不知道哪些是最关键的，楼主应该以最简洁的代码，实现一个能看到效果的demo，哎网上找了十几个教程，想实现一个能写入1000个数字，并把这1000个数字读出来，没有一个能够实现的....TUT
tensorflow入门：TFRecordDataset变长数据的batch读取
qq_43284966: 你好想问一下serial_exmp是什么

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。