我们在处理数据的时候,经常会遇到量纲不一样的情况。例如1元和1角,数值都为1,但是谁大呢?这种情况对我们人而言,已经是常识了,但是对机器呢?还有我们不熟悉的情况呢?这就需要归一化(normalization),我们需要将它们映射到统一的一个区间,使得在这个区间内直接对它们操作是合理的。在知乎上我一个同学是这样回答的“归一化首先在维数非常多的时候,可以防止某一维或某几维对数据影响过大,其次可以程序可以运行更快。方法很多,min-max,z-score,p范数等,具体怎么使用,要根据数据集的特征来选择。”(http://www.zhihu.com/question/20455227)
归一化具体的是指,将数据按比例缩放,使之落入一个小的特定区间。
常用的归一化方法有:
1. min-max归一化
这是一种线性规范化,具体计算公式为:

归一化是解决数据量纲不一致问题的关键技术,它将数据映射到特定区间,如[-1, 1]或[0, 1]。常见的归一化方法包括min-max、z-score、小数定标和p范数归一化。每种方法在后续计算中可能产生不同影响,选择合适的方法至关重要。"
119044491,10915759,Spring Cloud Alibaba Nacos与Sentinel实战详解,"['spring cloud alibaba', 'nacos', 'sentinel']
最低0.47元/天 解锁文章
3380

被折叠的 条评论
为什么被折叠?



