中心化和规范化

最新推荐文章于 2022-05-24 16:10:18 发布

zzz._

最新推荐文章于 2022-05-24 16:10:18 发布

阅读量891

点赞数

本文链接：https://blog.csdn.net/qq_45084416/article/details/102336376

版权

1.中心化

使变量均值为0的预处理过程叫做中心化。
按我的理解，可以将X看做一个数据云，中心化就是将数据云的“重心”移到原点的位置。

中心化代码的例子：

D=784  #数据维度
N=128  #样本数量
X=np.random.randn(N,D)
X-=np.mean(x,axis=0)

mean()函数是求平均值，axis=0是行行相加，也就是不改变样本的维度；axis=1的话是列列相加，也就是不改变样本的数量。在线性代数里，a=[1,2,…,n]就叫做n维向量。 X中，一行为1个样本，1个样本中有784个数据，所以这个样本有784个维度（说的太啰嗦了…）

2.规范化

最常用的规范化是中心化的X除以标准差

D=784  #数据维度
N=128  #样本数量
X=np.random.randn(N,D)
X-=np.mean(X,axis=0）
X/=np.std(X,axis=0)

std()函数是计算X的标准差，在这里插入图片描述 r是平均值，方差是标准差的平方。

3.中心化和规范化的组合操作

3.1操作一

对随机变量的标准化，变为均值为0，方差为1的分布。数学公式为：x^=(x-u)/α，u为均值，α为标准差。

3.2操作二

把每个属性的取值都统一到[-1,1]区间内这个方法利用每个属性的最大值和最小值很容易实现。

N=128  #128个样本
D=784  #每个样本784个维度
X=np.random.randn(N,D)
minX=np.min(X,axis=0)
maxX=np.max(X,axis=0)
X=(X-minX)/(maxX-minX)  #1
X=2*X-1                 #2

1,将x取值都在[0,1]之间
2,将x取值平移，在[-1,1]内

这个方法比较容易受到噪声或异常值的影响。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zzz._

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

二维随机变量期望公式_多维随机变量的特征数

weixin_33216825的博客

01-05

5112

学习不易，把知识点讲清楚更是难上加难……这一节是将特征数从一维推广到多维的情况。（一维的还没写，如果有时间以后会补充）。先给出理论知识，最后给出一些习题及解答。多维随机变量（函数）的数学期望和方差若二维随机变量 的分布用联合分布列或用联合密度函数表示，下面讨论：1.多维随机变量的数学期望和方差在离散场合：的数学期望的方差：同样可给出的数学期望和方差。在连续场合：的数学期望 ...

中心化处理（mean centering）的迷思和真相

TeamLee的博客

05-04

2万+

带调节的回归模型中经常会遇到是否需要对变量进行中心化处理（减去均值），Hayes用数据表明，中心化处理能一定程度上减少多重共线性的影响，但对交互项的检验没有任何影响——交互项的系数在中心化前后并没有任何差别。

参与评论您还未登录，请先登录后发表或查看评论

中心化和标准化

张之海的博客

09-03

9584

1 为什么会谈到中心化和标准化呢？因为在阅读《推荐系统》一书，学习“改进余弦相似度”和“Pearson”相关系数时，都谈到了减去均值（当然两者中用到的，是不同的均值）。这便是“中心化”，至于标准化，是在搜索中心化的内容附带学习的，以这种比较的方式拓展知识面，也是比较有效的。 2 中心化和标准化是什么？—— 定义 3 为什么要提出中心化和标准化的方法？ 4 中心化和标准化的实际应用有哪些？...

归一化、标准化和中心化/零均值化

长河落日的博客

06-25

671

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar

再谈线性回归函数分析，从概率论与数理统计角度看线性回归参数估计

weixin_30835649的博客

07-07

1841

1. 随机变量的数字特征 0x1：为什么我们需要统计随机变量的数字特征 随机变量的分布函数（或概率函数，或密度函数）已经非常全面了，精确地描述了这个随机变量取值的统计规律性，那为什么我们还需要研究随机变量的数字特征呢？这个小节我们来讨论一下这个话题。 1. 实际问题背后概率分布函数的复杂性在很多实际问题中（特别是一些具体的非物理的问题域），从实际问题场景中采样得到的样本集，一般时候都不会...

中心化和规范化1

08-03

中心化和规范化是数据预处理中的关键步骤，尤其在机器学习和数据分析中，它们能够显著影响模型的性能和训练效率。这两个概念都是针对特征向量的处理方式，目的是改善数据的性质，使其更适合于建模。 中心化是将数据...

政务服务中心规范化建设工作方案.doc

02-18

政务服务中心规范化建设工作方案.doc

最新疾控中心行业公司规范化管理制度.pdf

09-30

规范化管理大纲是疾控中心行业公司规范化管理的基础，它明确了管理的目标和方向，旨在通过合理的规章制度和流程设计，提升公司的运营效率和协同效应。法律工作制度则强调了公司在法律框架内的合规运作，确保所有业务...

企业信息化管理规范.doc

最新发布

11-20

《企业信息化管理规范》是指导企业有效管理和推进信息化建设的重要文档，旨在规范信息化建设的管理，构建稳定、安全、经济、高效、可持续的信息支撑体系，提高企业的现代化管理水平，促进企业快速发展。规范主要围绕...

消毒供应中心规范化管理的论文.docx

02-03

消毒供应中心是医疗机构中负责医疗用品清洗、消毒、灭菌及发放的重要部门，其工作的规范化程度直接影响到医院整体的服务质量和患者的健康安全。在这一过程中，标签指示胶带作为记录和追踪医疗用品信息的重要工具，其...

概率论数理统计笔记01（对应教材——《概率论与数理统计》（同济大学出版社出版））

weixin_44821319的博客

05-01

2653

概率论数理统计 随机变量及其分布 随机变量的概念定义：在随机试验E中，Ω是相应的样本空间，如果对样本空间中每一个样本点ω，有唯一的一个实数X与之对应，那么就把定义域为Ω的单值实值函数X = X(ω)称为随机变量。随机变量是样本点的函数，定义域为样本空间，一个随机变量取值可以对应一个样本点，也可以对应多个样本点 随机变量一般用大写字母表示，随机变量的取值一般用对应的小写字母表示。离散型随机变量：...

基于深度学习的轴承故障诊断

秋雨行舟

05-24

7147

该专栏将较为详细的介绍如何利用深度学习进行故障诊断方面的学术研究，主要以轴承为例，包括深度学习常用框架Tensorflow的搭建以及使用，并会记录完整搭建过程，并以卷积神经网络与循环神经网络为例进行代码编写和实际运行，相信经过本次学习，你能够入门开始着手研究。完成该专栏的学习，你将会收获以下知识： 1.Anaconda的安装以及使用，深度学习框架Tensorflow2的安装以及使用 2.学会如何利用卷积神经网络与循环神经网络进行轴承故障诊断-以凯斯西楚大学轴承数据集为例 3.学会一些常用调参技巧

数据的中心化和标准化

lilong117194的博客

11-17

3万+

简介：意义：数据中心化和标准化在回归分析中是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。原理：数据标准化：是指数值减去均值，再除以标准差；数据中心化：是指变量减去它的均值。目的：通过中心化和标准化处理，得到均值为0，标准差为1的服从标准正态分布的数据。在回归问题和一些机器学习算法中，以及训练神经网络的过程中，还有PCA等通常需要对原始数据进行中心化（Zero-center

S&p_05_随机变量函数的分布及随机变量的数字特征

weixin_30401605的博客

08-10

866

1. 随机变量的函数仍然是随机变量。解题思路：将Y=g(X)转换成X=g(y)，再将g(y)代入解题。 2. 随机变量X的数学期望就是求加权平均值。分离散型和连续型。期望是随机变量的中心化特征，是随机分布的平均值。方差是随机变量对期望（平均值）偏离程度的度量。你首先是已知在每一状态下的取值，以及概率。然后你才能推断出期望。而概率在大多出情况下是由频数近似而来的。频数就...

主成分分析中心化和标准化_复杂世界的去中心化分析

danpu0978的博客

05-21

1423

主成分分析中心化和标准化 2015年，斯坦·麦克里斯特（Stan McChrystal）将军出版了《团队团队：复杂世界的新参与规则》。这是他适应世界的经验的顶点，而变化的速度比他负责领导的组织要快。当他在2003年担任联合特种作战特遣部队司令时，他意识到他们的典型沟通方式正在失败。敌人是一个分散的网络，可以快速移动，因此，他的组织的传统优势（设备，培训等）都没有关系。他认为有必...

中心化（又叫零均值化）和标准化（又叫归一化）