机器学习
shushu66
这个作者很懒,什么都没留下…
展开
-
为什么要独热编码
一、为什么要独热编码?独热编码(哑变量 dummy variable)是因为大部分算法是基于向量空间中的度量来进行计算的,为了使非偏序关系的变量取值不具有偏序性,并且到圆点是等距的。使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点。将离散型特征使用one-hot编码,会让特征之间的距离计算更加合理。离散特征进行one-hot编码后,编码后的特征,...转载 2020-03-05 21:41:52 · 1016 阅读 · 0 评论 -
过拟合及解决方法
转载来源:https://blog.csdn.net/u010899985/article/details/79471909一.过拟合在训练数据不够多时,或者over-training时,经常会导致over-fitting(过拟合)。其直观的表现如下图所所示。在这里插入图片描述随着训练过程的进行,模型复杂度,在training data上的error渐渐减小。可是在验证集上的error却反...转载 2020-02-27 20:44:41 · 957 阅读 · 0 评论