机器学习
文章平均质量分 85
默默的沉默者
这个作者很懒,什么都没留下…
展开
-
数据预处理--采样
采样采样就是按照某种规则从数据集中挑选样本数据。通常应用场景数据样本过大,抽取少部分样本来训练或验证,不仅可以节约计算机资源,在特定情况下也会提升实验效果。随机采样随机采样是从被采样数据集中随机地抽取特定数量的数据,需要指定采样的个数。随机采样分为有放回采样和无放回采样。有放回采样: 可能会出现重复数据无放回采样:采样数据不会出现重复的样本数据系统采样系统采样又称等距采样,就是将总体的采样数据集按原创 2018-01-19 14:05:16 · 4469 阅读 · 0 评论 -
数据预处理--归一化
归一化是指一种简化计算的方式,将数据经过处理后限定到一定的范围之内,一般都会将数据限定在[0,1]。数据归一化可以加快算法的收敛速度,而且对后续的数据处理上也比较方便。归一化算法是一种去量纲的行为。归一化具体计算方法:y=(x-MinValue)/(MaxValue-MinValue),这里的MaxValue和MinValue分别是矩阵中每一个字段的最大值和最小值,x是字段中的值,y是归一化结原创 2018-01-19 18:15:08 · 1677 阅读 · 0 评论 -
数据预处理--噪声
1.噪声是什么?数据集中的干扰数据(对场景描述不准确的数据)2.噪声怎么产生的?举个例子:手机信号来自于基站发射的电磁波,有的地方比较强,有的地方比较弱。运营商的工程师会负责统计不同区域信号强弱来进行网络规划,工程师采集信号的方法就是将一个信号接受终端固定到车上,然后开车绕着基站转,信号终端就会自动采集不同区域的信号强度,生成一份数据。但是如果车在采集过程中遇到了突发事件、急刹车,就可能会对信原创 2018-01-20 21:55:19 · 26914 阅读 · 0 评论