归一化是在实现算法时经常使用的操作。本文的目的是说明归一化的作用。
假设有一组数列,或者说向量(1,2,3,4)
一、使用无穷范数归一化
无穷范数是指这组数列中最大的数,即4,归一化后结果为(1/4,2/4,3/4,4/4)。
假设(1,2,3,4)是某国不同阶层人均月收入,而(3,4,6,8)是另一国不同阶层的人均月收入。比较两国的贫富差距,一种方法是4-1=3,8-3=5,得出绝对贫富差分别为3和5.另一种方法是使用无穷级数进行归一化,得出其他阶层相对最高收入阶层的
收入占比1/4和3/8.
二、使用Frobenius范数归一化
当该数列为欧式空间中的向量或点时,可以使用该归一化方法,比如,在文本处理过程中,假设数列为某一文本中四个不同的词的计数结果,则可以使用该数列表示该文本。当另一文本包含同样的四个词汇时,可以得到另一个数列,比如(2,4,6,8)。显然,影响计数结果的一个重要因素是文本长度,因此为了
消除文本长度对统计结果的影响,通常使用2范数进行归一化。
三、Frobenius范数的推广
2范数可以推广到任意范数的归一化,其一般计算方法为: