Python数据分析与挖掘实战学习05

本文介绍了Python在数据分析中的应用,涉及概率论中的本福特定律、Nagel-Schreckenberg交通流模型,以及贝叶斯先验的概念。通过实例展示了如何运用Python进行计算,还探讨了条件概率、全概率公式、贝叶斯公式,并对数据质量分析中的异常值检测进行了讨论。
摘要由CSDN通过智能技术生成

一、概率论与贝叶斯先验

1.本福特定律

(1)概念

本福特定律又称第一数字定律,是指在实际生活得出的一组数据中,以1为首位数字出现的概率约为总数的三成,是直观想象1/9的三倍。

给定某正整数N,统计从1到N的所有数所对应的阶乘中,首位数字出现1-9各自的概率。

代码如下:

其中first_digital函数中,由于参数x为整数,所以在进行除法运算时,需要使用“//”来表示整数除法,而“/”表示浮点除法运算。Python中的这种除法运算与其他语言是有些区别的,通常C或C++中,“/”算术运算符的计算结果是根据参与运算的两边的数据来决定的。其运行结果如下:

从运行结果可以看出,首位数字是“1”出现的次数为293,大概为其总数1000的1/3。随着样本规模不断增大,其出现概率会越来越接近1/3。

在阶乘、素数数列、斐波那契数列首位以及住宅电话号码中都可以看到本福特定律的影子,它还可以用来进行经济数据反欺诈和选举投票反欺诈。

2.Nagel-Schreckenberg交通流模型

路面上有N辆车,以不同的速度向前行驶,模拟堵车问题。有以下假设:

(1)假设某辆车的当前速度为v。

(2)若前方可见范围内没有车辆,则它在下一秒的车速提高到v+1,直到达到规定的最高限速。

(3)若前方有车,前车的距离为d,且d<v,则它下一秒的车速降到d-1。

(4)每辆车会以概率p随机减速v-1。

    代码如下:

运行结果如下:

3.概率公式

(1)条件概率:

(2)全概率公式

(3)贝叶斯公式:

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值