区间估计

这里的场景是:给出一组数据,估计一个区间,使得区间内的数据大致成均匀分布,并且保证区间内的数据能够包含总体的大部分数据。
(统计学中“区间估计”指的是,用来描述根据样本求得的值与总体真实值之间的误差)

一、工具

  1. Python:
    pandas包:画图、数据分析比Java更有优势

  2. Java:
    Range类:生成一个区间范围,方便判断数据是否在区间内;
    Predicate类;
    lambda表达式
    二、应用场景
    假设有一组无规律数据X[x1,x2,x3,x4,x5,x6,…],需要估算它的有效区间范围[a,b],可以保证大部分数据都落在a,b范围内容。
    三、计算方法

    1. 排序,从小到大;
    2. 取1/4处的值,假设为x;
    3. 取3/4处的值,假设为y;
    4. a=x-1.5*(y-x);
    5. b=y+1.5*(y-x);

四、原理
和箱线图绘制的原理相似,找到数据的四分位数。
如果用一组数据画一个柱状图,对于横坐标的选择,第一反应是用数据的最小值作为起点,数据的最大值作为终点(刻度)。但是这里有个问题:如果数据分布不均匀(标准差很大),比如100个值中最小值为1,最大值为1000,但其他值都小于5,那么画出来的图就很不“美观”。最好的办法是找到一个区间,可以包含大部分的数据,找四分位数是一种相对简单的方法,这是一种从经验中得来的方法,但大部分情况下都很有用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值