论文篇-----基于拉依达准则的交通数据粗大误差处理优化方法

重要概念:
互联网+:就是“互联网+各个传统行业”,但这并不是简单的两者相加,而是利用信息通信技术以及互联网平台,让互联网与传统行业进行深度融合,创造新的发展生态。它代表一种新的社会形态,即充分发挥互联网在社会资源配置中的优化和集成作用,将互联网的创新成果深度融合于经济、社会各域之中,提升全社会的创新力和生产力,形成更广泛的以互联网为基础设施和实现工具的经济发展新形态。
拉依达准则:是指先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。这种判别处理原理和方法仅局限于对正态分布或近似正态分布的样本数据处理,它是以测量次数充分大为前提的,当测量次数少的情形是不可靠的。
对于可疑数据的取舍要慎重。在试验进行中时,若发现异常数据,应立即停止试验,分析原因并及时纠正错误;当为试验结束后时,应先找原因,在对数据进行取舍。但对于异常数据一定要慎重,不能任意的抛弃和修改。往往通过对异常数据的观察,可以发现引起系统误差的原因,进而改进过程和试验。
标准差算法:标准差公式得到的样本标准差是对总体标准差的无偏估计,由于标准差算法具有从整体上描绘数据分布状态和离散程度。
个人所悟:
这篇文章主要是为了提高交通数据的质量,相当于对不良的数据进行剔除,采用的做法是基于拉依达准则,由于其比较适合于大样本的情况,并用了一组数据进行验证,说明结果是合理的。所以,其针对的目标是数据预处理传统算法在交通大样本容量下未能精确剔除异常值的问题,创新性地设计了拉依达准则优化方法。
优缺点:
从某种程度确实提高数据的精确性,另一方面,在大数据时代,样本容量如此高的情况下,这样做是否有意义?值得思考!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值