比如x1的范围是[0,10],x2的范围是[0,100]。 两者的量纲是不等的,可想而知相比于x1,x2需要更多的迭代步数才能收敛到最佳值,从而使最后的结果更青睐于x2特征。 而当归一化后,x1,x2的量纲相等, 不仅能减少迭代步数,还能使两种特征对最后的结果影响相同。