java区间估计_预测区间计算.ppt

预测区间计算

概率统计与随机过程 宋 晖 – 2013年秋 第二章 样本估计 统计基础 区间估计 单样本:估计均值 预测区间 两样本:估计均值差 区间估计(interval estimation) 引入 点估计方法简单,意义明确,但无法判断估计结果的稳定性、估计值因样本不同产生误差 考虑寻找参数存在的范围,以及落入该范围的概率 根据样本数据,求得两个数值,构成一个置信区间(confidence interval,C. I.),给出参数的可能范围。 估计大学生平均每月可用零用钱为1000元,该估计为单一数值,是点估计;若估计大学生平均每月可用零用钱介於600~2000元,为区间估计。 关系 置信区间估计量基于点估计 随着样本容量增大,σ2/n随之减少,估计区间变小 则称随机区间 为θ 的置信水平为1- α 的置信区间, 分别称为置信下限和置信上限。 定义:设总体 使得 有 若存在两个统计量 置信水平也称为置信度, 通常α较小,1-α较大 连续型总体,则取 离散型总体,则取 尽可能接近1-α 例1 :假设容器中装的硫磺酸容量逼近正态分布,7个容器中的容量分别为 :9.8,10.2,10.4,9.8,10.0,10.2和9.6L。求所有容器均值的95%的置信区间。 问题分析: 样本 {xi}~ N(μ, σ2) 根据抽样数据,可得: 1)样本均值 2)标准差 求解: 估计均值的置信区间 单样本:估计均值 样本均值符合正态分布 ~ N(μ, σ2/n) 存在历史经验参数 σ 没有经验参数,σ未知? 故对于给定的置信水平 1-α, 查表可求得 Z α/2 使得 等价地有: μ的样本均值为 ,根据Lindeberg-Levy定理 样本均值估计,σ = σ0已知 1- α Z1- α /2 1- α 于是 μ 的置信水平为0.95 的一个置信区间为 例如: σ0 =1, 则 未知参数μ 的置信水平为1-α 的置信区间 给出了μ 的点估计 给出了μ 所在的一个范围 , 都可以作为μ 的点估计 其估计误差: 以上分析的可信度为95%, 即若反复抽样100 次,则包含真值μ的区间 约有95 个,不包含μ的区间大约只有 5 个. 置信度1- α 的实际含意是什么? 是否一定包含真值μ? 样本均值估计, σ未知 对给定的置信水平1-α,可求得 ,使得 μ, σ2的无偏估计分别为 ,那么 1- α -tα/2 tα/2 等价地有 故μ的置信水平为1-α 的置信区间为 均值μ的置信水平为1-α 的置信区间 例1 –解答:假设容器中装的硫磺酸容量逼近正态分布,7个容器中的容量分别为 :9.8,10.2,10.4,9.8,10.0,10.2和9.6L。求所有容器均值的95%的置信区间。 解:根据抽样数据,样本均值和标准差分别为10.0和0.283. 共有7个样本,自由度 n = 6,α =0.05 查表可得 t = 2.447。由此,μ的95%的置信区间为: 即:9.47< μ <10.26 单边置信 对于给定的置信水平 1-α,查表可求得 Z α 使得 单边上界: 单边下界: 某些应用中,只需要考虑单边界, 如: 网络传输允许的最大丢包率 硬盘的寿命下限 预测区间 给出新样本可能出现的数据范围,以及置信度 利用估测样本预测新样本的观测值 例2:Citizen银行收到抵押申请,最新50个申请样本中,平均值为257 300美元,假设总体标准差为25 000美元,那么置信度为95%时下一名顾客借贷金额? 问题分析: 样本 {xi} ~ N(μ, σ2) 根据抽样数据,可得:样本均值、标准差 求解: 预测值的置信区间 预测值的分布 假设:新观测值为X0,随机误差的方差为σ2 ,所有样本都来自于正态分布总体。 构造统计量: Y ~ N(0,1),利用统计量Y 的概率分布可以计算: 例2-解答:Citizen银行收到抵押申请,最新50个申请样本中,平均值为257 300美元,假设总体标准差为25 000美元,那么置信度为95%时下一名顾客借贷金额? 解:总体方差为25,000,样本值为257,300。 y0.025=1.96 即:207 812.43< x0 <306787.57 预测区间计算,σ 未知:对于未知均值μ 、方差σ2未知的正态抽样分布,新观测值x0置信度为1- α的预测区间为: 例3:随机检验30包瘦牛肉,样本结果的均值为瘦肉含量96.2%,标准差为0.8%

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SELECT PIS.SHOW_FLT_DETAIL AS SHOW_FLT_DETAIL -- new , PIS.SHOW_AWB_DETAIL AS SHOW_AWB_DETAIL -- new , PIS.DISPLAY_AIRLINE_CODE AS CARRIER_CODE , DECODE(PIS.REVERT_FLOW,'N',PIS.FLOW_TYPE,DECODE(PIS.FLOW_TYPE,'I','E','I')) AS FLOW_TYPE , PIS.SHIP_TO_LOCATION AS SHIP_TO_LOCATION , PIS.INVOICE_SEQUENCE AS INVOICE_SEQUENCE , PFT.FLIGHT_DATE AS FLIGHT_DATE , PFT.FLIGHT_CARRIER_CODE AS FLIGHT_CARRIER_CODE , PFT.FLIGHT_SERIAL_NUMBER AS FLIGHT_SERIAL_NUMBER , PFT.FLOW_TYPE AS AIRCRAFT_FLOW , FAST.AIRCRAFT_SERVICE_TYPE AS AIRCRAFT_SERVICE_TYPE , PPT.AWB_NUMBER AS AWB_NUMBER , PPT.WEIGHT AS WEIGHT , PPT.CARGO_HANDLING_OPERATOR AS CARGO_HANDLING_OPERATOR , PPT.SHIPMENT_PACKING_TYPE AS SHIPMENT_PACKING_TYPE , PPT.SHIPMENT_FLOW_TYPE AS SHIPMENT_FLOW_TYPE , PPT.SHIPMENT_BUILD_TYPE AS SHIPMENT_BUILD_TYPE , PPT.SHIPMENT_CARGO_TYPE AS SHIPMENT_CARGO_TYPE , PPT.REVENUE_TYPE AS REVENUE_TYPE , PFT.JV_FLIGHT_CARRIER_CODE AS JV_FLIGHT_CARRIER_CODE , PPT.PORT_TONNAGE_UID AS PORT_TONNAGE_UID , PPT.AWB_UID AS AWB_UID , PIS.INVOICE_SEPARATION_UID AS INVOICE_SEPARATION_UID , PFT.FLIGHT_TONNAGE_UID AS FLIGHT_TONNAGE_UID FROM PN_FLT_TONNAGES PFT , FZ_AIRLINES FA , PN_TONNAGE_FLT_PORTS PTFP , PN_PORT_TONNAGES PPT , FF_AIRCRAFT_SERVICE_TYPES FAST , SR_PN_INVOICE_SEPARATIONS PIS --new , SR_PN_INVOICE_SEP_DETAILS PISD--new , SR_PN_INV_SEP_PORT_TONNAGES PISPT --new WHERE PFT.FLIGHT_OPERATION_DATE >= trunc( CASE :rundate WHEN TO_DATE('01/01/1900', 'DD/MM/YYYY') THEN ADD_MONTHS(SYSDATE,-1) ELSE ADD_MONTHS(:rundate,-1) END, 'MON') AND PFT.FLIGHT_OPERATION_DATE < trunc( CASE :rundate WHEN TO_DATE('01/01/1900', 'DD/MM/YYYY') THEN TRUNC(SYSDATE) ELSE TRUNC(:rundate) END, 'MON') AND PFT.TYPE IN ('C', 'F') AND PFT.RECORD_TYPE = 'M' AND (PFT.TERMINAL_OPERATOR NOT IN ('X', 'A') OR (PFT.TERMINAL_OPERATOR <> 'X' AND FA.CARRIER_CODE IN (SELECT * FROM SPECIAL_HANDLING_AIRLINE) AND PPT.REVENUE_TYPE IN (SELECT * FROM SPECIAL_REVENUE_TYPE) AND PPT.SHIPMENT_FLOW_TYPE IN (SELECT * FROM SPECIAL_SHIPMENT_FLOW_TYPE) AND PFT.FLIGHT_OPERATION_DATE >= (select EFF_DATE from SPECIAL_HANDLING_EFF_DATE) )) AND PFT.DELETING_DATETIME IS NULL AND FA.AIRLINE_UID = PFT.AIRLINE_UID AND FA.DELETING_DATETIME IS NULL AND PTFP.FLIGHT_TONNAGE_UID = PFT.FLIGHT_TONNAGE_UID AND PTFP.RECORD_TYPE = 'M' AND PTFP.DELETING_DATETIME IS NULL AND PPT.TONNAGE_FLIGHT_PORT_UID (+)= PTFP.TONNAGE_FLIGHT_PORT_UID AND PPT.RECORD_TYPE (+)= 'M' AND PPT.DISCREPANCY_TYPE (+)= 'NONE' AND PPT.ADJUSTMENT_INC_FLAG (+)= 'Y' AND PPT.DELETING_DATETIME (+) IS NULL AND FAST.AIRCRAFT_SERVICE_TYPE_UID = PFT.AIRCRAFT_SERVICE_TYPE_UID AND FAST.DELETING_DATETIME IS NULL AND PIS.TEMPORAL_NAME = TO_CHAR((CASE :rundate --new WHEN TO_DATE('01/01/1900', 'DD/MM/YYYY') THEN TRUNC(SYSDATE) ELSE TRUNC(:rundate) END ), 'YYYYMM') || '00' AND PIS.INVOICE_SEPARATION_UID = PISD.INVOICE_SEPARATION_UID --new AND PISD.INVOICE_SEP_DETAIL_UID = PISPT.INVOICE_SEP_DETAIL_UID --new AND PISPT.PORT_TONNAGE_UID = PPT.PORT_TONNAGE_UID --new AND PIS.PRINT_SUPPORTING_DOC = 'Y';上面是oracle的写法,请转成spark SQL的写法。
06-02
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值