数据流模型——【数据科学与工程算法基础】

一、数据流模型

        流动的数据(当作无限的元组序列):总量不限、速率快、无次序、一次性。

        子模型:

        一类按元素作用:时间序列;收银机(前缀和,不断叠加);十字转盘(加入的数据有正有负)。

        二类按元素重要性:界标模型(规定不同数据段重要性);滑动窗口(只考虑窗口元素);衰减窗口(新到重要,旧者重要程度低)。

二、概要数据结构

        保存数据流再查询不可能,需要一种远小于数据流规模的数据结构来查询元素,如直方图、抽样、小波、哈希。

三、近似算法

        既然概要了,就不可能很精确,只能近似估计,近似算法就相当于一种误差的评估。

       (1)∈相对误差

         一个∈代表相对误差,输出值与真值相差小于∈乘以真值。

       (2)∈绝对误差

        一个∈就是一个值,输出值与真值相差小于∈。

       (3)相对误差Plus

        利用切比雪夫不等式将上面两种情况变化:

        1. 输出值与真值相差小于∈乘以真值的概率大于1-x;

        2. 输出值与真值相差小于∈的概率大于1-x。

  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值