样本归一化

最新推荐文章于 2024-09-24 11:49:03 发布

ttxzszxy

最新推荐文章于 2024-09-24 11:49:03 发布

阅读量4.2k

点赞数

分类专栏： HIT_bs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ttxzszxy/article/details/51475374

版权

博客内容介绍了样本数据预处理中的归一化操作，强调了归一化在处理奇异样本和解决样本不均衡问题中的作用。讨论了mapminmax()函数的应用，以及在训练数据和测试数据间的归一化一致性。还提到了其他归一化方法如mapstd和processpca，并指出归一化在不同范围的意义，特别是在神经网络中与sigmoid函数的关系。

摘要由CSDN通过智能技术生成

train_data和test_data同时，先归一化再降维

归一化针对相同维度进行，

注意样本不均衡问题

归一化：

属于数据preprocess，比方：奇异样本数据(相对于其他输入样本特别大或特别小的样本矢量) 就需要规一化

1. mapminmax()

将矩阵的每一行归一到[-1 1].

[y,ps] = mapminmax(x1) %y=(ymax-ymin)*(x-xmin)/(xmax-xmin)+ymin;

其中y是对进行某种规范化后得到的数据，这种规范化的映射记录在结构体ps中。

并不是任何问题都需先对原始data归一化。【原始data规范化后，实际意味着你承认了一个假设：test数据集的每一模式的所有特征分量的max(min)不会大于(小于)train数据集的每一模式的所有特征分量的max(min)，但这条假设显然过于牵强。使用平均值方差法也会有同样类似的问题。】

另一种观点：

当需要对另外一组数据做归一时，比如SVM 中的 training data用以上方法归一，而test data就可以用下面的方法做相同的归一了</

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

ttxzszxy CSDN认证博客专家 CSDN认证企业博客

码龄9年

33: 原创

106万+: 周排名

177万+: 总排名

11万+: 访问

: 等级

1165: 积分

12: 粉丝

19: 获赞

7: 评论

92: 收藏

私信

关注

热门文章

分类专栏

matlab2014 8篇
matlab命令 4篇
dp特征 1篇
cell 1篇
D-S 1篇
机器学习 3篇
基本概念 2篇
excel 1篇
宏操作 1篇
毕设
HIT_bs 20篇
工作 1篇
产品 1篇
HTML 1篇

最新评论

类内距离&类间距离
克列玛: 输入什么样的矩阵啊
类内距离&类间距离
weixin_44435353: 我也想问，可以用Sw、Sb吗
类内距离&类间距离
qq_39958146 回复于金莹: 请问你弄懂了，标准格式应该怎么设置
类内距离&类间距离
于金莹: %y --一个N维行向量，第i个元素包含X中第i个向量的label（总共有c个类标）请问y值是什么意思呢？
类内距离&类间距离
ZDY951103: 算出来的这个Sw、Sb是自己可以作为调用画ROC曲线函数的参数吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。