基于2022高考数学全国卷I概率题解题思路初步分析新冠病毒疫苗
1. 2022高考数学全国卷I概率题
一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好 | 良好 | |
---|---|---|
病例组 | 40 | 60 |
对照组 | 10 | 90 |
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生惯不够良好”?B表示事件“选到的人有该疾病”, P ( B ∣ A ) P ( B ˉ ∣ A ) \frac{P(B|A)}{P(\bar{B}|A)} P(Bˉ∣A)P(B∣A)与 P ( B ∣ A ˉ ) P ( B ˉ ∣ A ˉ ) \frac{P(B|\bar{A})}{P(\bar{B}|\bar{A})} P(Bˉ∣Aˉ)P(B∣Aˉ)的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为 R R R.
(I)证明: R = P ( A ∣ B ) P ( A ˉ ∣ B ) ⋅ P ( A ˉ ∣ B ˉ ) P ( A ∣ B ˉ ) R=\frac{P(A|B)}{P(\bar{A}|B)}·\frac{P(\bar{A}|\bar{B})}{P(A|\bar{B})} R=P(Aˉ∣B)P(A∣B)⋅P(A∣Bˉ)P(Aˉ∣Bˉ);
(II)利用该调查数据,给出 P ( A ∣ B ) P(A|B) P(A∣B), P ( A ∣ B ˉ ) P(A|\bar{B}) P(A∣Bˉ)的估计值,并利用(I)的结果给出 R R R的估计值.
附 : K 2 = n ( a d − b c ) 2 ( a + b ) ( c + d ) ( a + c ) ( b + d ) , 附:K^2=\frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}, 附:K2=(a+b)(c+d)(a+c)(b+d)n(ad−bc)2,
P ( K 2 > k ) P(K^2>k) P(K2>k) | 0.05 | 0.010 | 0.001 |
---|---|---|---|
k k k | 3.841 | 6.635 | 10.828 |
2. 卡方( χ 2 \chi^2 χ2)检验原理回顾
通过抽样统计得到如下数据:
是否患肺病 | 抽烟 | 不抽烟 | 合计 | 抽烟比例 |
---|---|---|---|---|
是 | 158 | 169 | 327 | 48% |
否 | 82 | 311 | 393 | 20% |
合计 | 240 | 480 | 720 | 33% |
现在想知道是否患肺病与是否抽烟之间是否存在必然联系。
首先我们假设没有必然联系,即不管是患肺病的群体,还是未患肺病的群体,抽烟者的比例都是一样,为33%。
根据该假设,理论上的数值情况应该为下表:
是否患肺病 | 抽烟 | 不抽烟 | 合计 | 抽烟比例 |
---|---|---|---|---|
是 | 109 ≈ 327 ∗ 33.33 \approx 327 * 33.33 ≈327∗33.33% | 218 ≈ 327 ∗ 66.67 \approx 327 * 66.67 ≈327∗66.67% | 327 | 33.33% |
否 | 131 ≈ 393 ∗ 33.33 \approx 393*33.33 ≈393∗33.33% | 262 ≈ 393 ∗ 66.67 \approx 393 *66.67 ≈393∗66.67% | 393 | 33.33% |
合计 | 240 | 480 | 720 | 33.33% |
统计抽样的数值为实际频数,记为 A i , j A_{i,j} Ai,j,理论数值记为 T i , j T_{i,j} Ti,j,统计量 χ 2 = ∑ ( A i , j − T i , j ) 2 T i , j \chi^2=\sum\frac{(A_{i,j}-T_{i,j})^2}{T_{i,j}} χ2=∑Ti,j