算法题整理(待更新,不全面)
1. 分类与回归的区别
回归:输入变量与输出变量均为连续变量的预测问题(预测结果为某一值,该值有无限种可能);
分类:输出变量为有限个离散变量的预测问题(预测结果范围只有几个值或多个值);
2. 归一化和标准化的区别
归一化:将训练集中某一列数值特征xi(设第i列)的值缩放到0-1之间 x i − m i n ( x i ) m a x ( x i ) − m i n ( x i ) \frac{xi-min(xi)}{max(xi)-min(xi)} max(xi)−min(xi)xi−min(xi)
标准化:将某一列值缩放成均值为0,方差为1( x i − x ˉ ρ ( x ) \frac{xi-\bar{x}}{\rho(x)} ρ(x)xi−xˉ)
好处:① 提升模型精度;② 提升收敛速度;
问题1:
问:逻辑回归必须归一吗?
答:看是否用正则,用正则则需要;
问:Why?
答:加上正则后,损失函数除了度量预测与真实差距,还要度量参数值k是否足够小(y=kx)&#x