小白:“宝藏蒋,啥是数字归一化呀?”
蒋宝藏:“数学建模中不是有很多步骤嘛~数字归一化相当于是准备工作,你搜集到一堆数据以后,要先预处理一下。”
今天的蒋宝藏课堂就给大家解释有关数据归一化的知识
快拿起你的小马扎来听课吧!!!
数据归一化是个啥玩意?
数据归一化是指对一列数据进行相同方法的处理,使得达到消除量纲或规范化的目的。
为啥要把数据归一化?
因为在数据变量数较多时,各个变量的量纲单位可能不一样,各个变量数值差距也较大,为了消除量纲和差异性,就需要对数据进行归一化。
数据归一化的分类
设共有n个样本,每个样本有m个变量。这是官方的话,用通俗的话来打个比方,浙江有11地级市,每个地级市在每年评比排名时呢,都会有很多指标数据,那这些指标数就是变量数。
(1) 极差标准化
设这11个城市的某个指标为 ,那么极差标准化就是把这列数减去这一列中最小值,除以最大值与最小值的差。即
x i j ~ = x i j − min ( x j ) max ( x j ) − min ( x j ) \widetilde {
{x_{ij}}} = \frac{
{
{x_{ij}} - \min ({x_j})}}{
{\max ({x_j}) - \min ({x_j})}} xij
=max(xj)−min(xj)xij−mi