统计学笔记——浙江大学版

第一章 概率论基本概念

第一章  概率论基本概念

概率论是研究试验结果集确定,但是具体结果是哪个不确定的学科。物理学和数学中相当一部分内容都是研究确定性的东西,并且这些确定性的东西可以用一个函数来表示,y=f(x1,x2...,xn),这里面的x就是影响结果y的因素,f是机制。将函数与现实世界中系统进行对应就是,x是系统运行的参数,f是运行机制,这种机制可能以电磁、化学或者机械形式进行,y就是在x条件下,按照f的机制下运行的结果。由于某种限制,我们不能找出所有影响y的所有x因素,这样的结果就是,可能影响y的因子有N个,但是由于设备或者智力的限制,我们暂时只找到了N-3个,那么另外3个未知因素的不确定将导致结果y的不确定,虽然是不确定,但并不意味着没有规律。概率论研究的是结果不确定,但是有一定分布规律的理论。通过概率论可以进行预计,用概率来表征某种结果产生的可能性大小,进而帮助我们做出判断。

确定性现象:一定条件下,必然会发生的现象叫确定性现象,注意:现象的发生都是有一定条件的。

随机现象:在个别试验中结果不确定,在大量试验中,结果符合统计规律的称为随机现象

一次试验和一个试验:这两个术语不是很好区分,书中也没有明确说明,完全是在乱用,一个试验里面可以包含很多次重复的操作,比如抛硬币,抛一次算一次试验,抛了很多次的总体集合算作一个试验。这两个概念不是很重要,因为对于试验的结果我们是用集合表示的,集合与元素来描述试验,这是很好区分的。

随机试验的集合描述:

1.试验在已知的相同条件下进行

2.某一次试验结果是不确定的

3.全部的试验结果是确定的,就是试验的结果不会超出一个总体集合。

用集合与随机试验对应起来就是:

试验的结果集用E表示,假设试验结果只有6种情况,分别为a,b,c,d,e,f

那么随机试验就可以用E={x|a,b,c,d,e,f}表示

样本空间与随机事件

随机试验的结果集又称为样本空间,这个样本空间就是抽样试验的结果,结果集里面允许重复。随机试验的结果又称为样本点。试验结果有5种,但是试验的结果可以有很多个,比如抛硬币有上下两种,但是1000次结果有1000个样本点。

随机试验的结果集或者说样本空间不一定是离散的,也可以是连续的,这种变量是连续型随机变量。注意:随机变量是因变量,不是自变量,自变量有很多个。

随机事件和事件:随机事件又称为事件,事件是指一个样本空间的子集,通常情况下人们考虑结果时候不止考虑一个样本点,而是多个元素结果。

事件发生:一个事件集合里面包含若干个结果元素,当出现一种元素时候,就表示这个事件发生了。

基本事件:单个样本点或者结果元素组成的事件称为基本事件。

必然事件:样本空间本身是必然事件,因为发生的结果都在其中

不可能事件:空集

语言转换:

发生XXX事件→一个结果集满足某个条件→对应一个集合

事件的关系及运算

由于事件就是集合,集合能进行运算,因而事件也能运算

事件相等:对应的两个集合相等

和事件:两个集合的并

积事件:两个集合的交集

差事件:A-B,集合的元素是A独有的,由于A-B∈A,因而A-B就是差事件发生时候A一定发生,但是B发生,所以差事件是A发生,但B不发生的时候。

实际应用时候要把自然语言模型转换成数学模型以便计算,就是将数学话而不是人话

 

互斥事件:A∩B=空集 ,称A和B互斥

    对立事件:S是样本空间,A∪B=S,且A∩B=空集

 

    事件的运算规律

    注意:事件的运算规律很重要,在求概率的过程中,通常把事件用集合表示,把一个大的集合用子集表示,利用规律求解。

    交换律:A∪B=B∪A

    结合律:A∪(B∪C)=(A∪B)∪C

            A∩(B∩C)=(A∩B)∩C

    分配律:A∪(B∩C)=(A∪B)∩(A∪C)

            A∩(B∪C)=(A∩B)∪(A∩C)

    摩根定律:

    ——      —    —

    A∩B   =  A  ∪  B

    ——    —  —

    A∪B   =A ∩ B

 

 

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在Python中,可以使用概率论中的随机变量分布来进行统计计算。常见的离散型分布包括二项分布和泊松分布,连续性分布包括正态分布、均匀分布和指数分布等。这些分布可以用来计算概率、期望和方差等统计量。 对于正态分布,可以使用scipy.stats库中的norm模块进行计算。例如,可以使用norm.cdf函数计算小于某个值的概率,使用norm.ppf函数计算给定累积概率时的反函数值。代码示例如下: ``` from scipy.stats import norm # 计算小于40的概率 p1 = norm.cdf(40, loc=50, scale=10) # 计算30到40之间的概率 p2 = norm.cdf(40, loc=50, scale=10) - norm.cdf(30, loc=50, scale=10) # 计算小于2.5的概率 p3 = norm.cdf(2.5, 0, 1) # 计算-1.5到2之间的概率 p4 = norm.cdf(2) - norm.cdf(-1.5) # 计算累计概率为0.025时的反函数值 q1 = norm.ppf(0.025, loc=0, scale=1) # 计算累计概率为0.975时的反函数值 q2 = norm.ppf(0.975, 0, 1) print(p1, p2, p3, p4, q1, q2) ``` 对于计算随机变量的概率分布的均值和方差,可以使用numpy库进行计算。代码示例如下: ``` import numpy as np # 假设有一个数据框df,其中包含了不合格品数和概率 mymean = sum(df['不合格品数'] * df['概率']) # 计算均值 myvar = sum((df['不合格品数'] - mymean) ** 2 * df['概率']) # 计算方差 mystd = np.sqrt(myvar) # 计算标准差 print(mymean, myvar, mystd) ``` 以上是关于Python统计学中随机变量的概率分布的一些基本操作和计算方法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Python统计学03——随机变量的概率分布](https://blog.csdn.net/weixin_46277779/article/details/126673517)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值