迭代式
总论:
问题:用数学的方式,对不确定性/可能性进行描述。
V1.0
存在问题:只解决了数学符号化,并没有解决数学化本身。数学化要尽可能的简约【奥卡姆剃刀原理:如非必要物增实体】
不需要单独定义事件c,可以由事件a、b表示。
V2.0
存在问题:原子事件无法描述连续性问题【无穷小事件可能性为0】
V3.0
名次解释?!bushi 幂集P(R)指原集合中所有的子集(包括全集和空集)构成的集族。
或者改为-域(更好)因为域是一个更小的概念【无穷大的集合无法被归一要排除这种情况】
群:一个集合对二元运算封闭,且有单位元、逆元,满足结合律
阿贝尔群:满足交换律的群
环:阿贝尔群+乘法
域:若逆运算也封闭,则称为域or代数,相当于对除法也封闭了。
定义是累积分布函数,下边就是概率密度函数,S为样本空间。
累积分布函数的好处:无论离散还是连续,累积分布函数的意义都是相同的。
通过随机变量可以把上面的概率空间等价变成下面的概率空间,此时样本空间里为实数(离散情况无需额外区分)
细分架构:
其中最底层(第一层地基)
密度:概率空间中一个点的权重值
质量:概率空间中一个或多个线段的权重值
第二层:将增加权重的思想升级到了多维
二维空间密度函数相当于在二维中定义了一个场:每个点的密度函数为空间中的权重值/质量值。
将多维空间中每个点都描述清楚的函数——联合概率密度函数(联合:可以在高维考虑低维情况;其中边缘概率和条件概率为不同的降维方式)
边缘概率
将二维空间的质量沿着x2轴压扁了
条件概率
将x2=a直线单独拿出来作为新的一维空间,但其整体质量不归一(<1)对权重等比放大。
其中分母为x2的边缘概率在a点的取值(<1)于是等比例放大
概率空间出现这么多新的东西本质上在于对P的描述。P中蕴含的信息不同导致概率空间的不同,若没有P则他们为普普通通的实数空间。
描述P:
P的无损描述——概率论
不同随机变量之间通过函数变换的方式进行相互表示,此时“=”表示等价
可知Y的累积函数,P中的信息都可表示出来了。
从简单——>复杂概率空间
换元的本质就是坐标变换(旋转、拉伸——拉伸的比例就是雅可比行列式,可以从微分换元中看出)
最后得到了卷积公式。
P的参数特征——数理统计
统计学:如何利用概率空间这个工具去帮助分析现实中的问题
归纳分析1:现实问题属于哪个分布
归纳分析2:具体参数取值
*确定参数就可以确定分布函数
统计量:通过抽样样本构建出来的,没有包含任何未知参数的新随机变量(比如Y、Xbar)
大数定律:抽样的样本数量越多,X bar随机变量的质量越会集中在期望值附近。(但期望值不变)
中心极限定理:若原本的概率空间存在期望和方差,不论原来概率空间分布是什么样的,只要n的数量够大,X bar这个随机变量的分布会接近一个正态分布。
经济学统计量:幂律分布是有可能没有期望的,因此用均值效果不好,应使用中位数进行评估。
*知道分布的类型
似然函数
法1:对概率分布通过拟合+最大似然估计去进行研究
法2:看作正态分布密度函数的叠加(复杂概率分布拆分为简单的)
P的整体特征——信息论
离散——信息熵;连续——微分熵
p(x)计算出的熵仅仅体现形状特征,和位置特征没有关系【体现P的整体特征】
log计算——把乘法换成加法(加法问题更容易用图像表示)
将概率以数学的角度去理解而不是以生活的角度,因为生活与数学有时候是不相匹配的。(比如概率为1与必然事件并不相同)
感谢老师分享,收获颇丰~也感谢大家的阅读~