处理数据
babychrislee3
这个作者很懒,什么都没留下…
展开
-
数据标准化处理
Z-score 标准化适用范围1.数据的最大值和最小值未知2.有超出取值范围的离群数据经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为:x∗=(x−μ)/σ标准化后的变量值围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。缺点估算Z-Score需要总体的平均值与方差,但是很难得到,大多数情况下是用样本的均值与标准差替代。对于数据的分布有一定的...原创 2019-12-28 21:51:15 · 4486 阅读 · 0 评论 -
过拟合、欠拟合
过拟合1)简单理解就是训练样本的得到的输出和期望输出基本一致,但是测试样本输出和测试样本的期望输出相差却很大 。2)为了得到一致假设而使假设变得过度复杂称为过拟合。想像某种学习算法产生了一个过拟合的分类器,这个分类器能够百分之百的正确分类样本数据(即再拿样本中的文档来给它,它绝对不会分错),但也就为了能够对样本完全正确的分类,使得它的构造如此精细复杂,规则如此严格,以至于任何与样本数据稍有...原创 2019-11-27 19:49:31 · 142 阅读 · 0 评论 -
数据处理(归一化等)
数据处理原创 2019-11-27 19:30:08 · 343 阅读 · 0 评论