Datawhale数学建模导论课程第九章学习心得(1)一机器学习与统计模型

本次学习主要学习了一些统计模型以及机器学习的内容,教程链接:

Datawhale 数学建模教程Descriptionicon-default.png?t=N7T8https://datawhalechina.github.io/intro-mathmodel/

这边注意,机器学习虽然用途广泛但是由于可解释性比较差所以建模过程并不是很适合用机器学习(当然对于自己啥也不懂的情况下,我还是觉得要是用了之后能做出来也是一个不错的解决方法)

一、统计模型

1.1.统计分布与假设检验

1.1.1统计量与常见统计分布

常见的统计分布有四种,分别是正态分布,卡方分布,t-分布,F-分布

正态分布:

卡方分布:

t-分布:

F-分布:

1.1.2正态性检验

正态检验包括但不限于:QQ图、KS检验、SW检验、JB检验

对于SW检验:

KS检验:

JB检验:

 QQ图:

 1.1.3独立性检验

我的理解独立性检验就是拿来判断两者关系是否有关系

该步骤一般分为:分析检验问题的类型,确定原假设和备择假设,构造检验统计量,计算检验统计量以及对应概率,判断概率是否在置信区间内,若满足则接受原假设;若不满足则推翻原假设,接受备择假设。

1.1.4两组样本的差异性检验

两组样本的差异性检验可以通过t-检验实现。T-检验分为三种不同的类型:单样本t检验、配对样本t检验 和独立样本t检验。

1.1.5方差分析与事后多重比较

方差分析(ANOVA)可以用于两个样本及以上样本之间的比较,并可以用于分离各有关因素并估计其 对总变异的作用,以及分析因素间的交互作用。方差分析可以用于均数差别的显著性检验、分离各有关 因素并估计其对总变异的作用、分析因素间的交互作用和方差齐性检验等。 方差分析的基本思想是通过比较不同组别之间的平均数差异来确定这些差异是否显著。它利用方差度量 每个组别的变异,并将这些变异分解为组内和组间变异。通过比较组间变异和组内变异的比例,可以判 断不同组别之间的平均数差异是否具有统计意义。如果组间变异的比例较大,说明组别之间的差异显 著。反之,如果组内变异的比例较大,说明组别之间的差异不显著,可能是由于随机误差的影响。因此,方差分析可以帮助我们确定不同因素对实验结果的影响程度,进一步揭示数据背后的规律和机制。 方差可以分解成三个部分:Q=Q1+Q2+Q3。其中,Q1是指多个控制变量单独作用引起的平方和,可以用 来描述每个变量单独是否存在影响;Q2是指多个控制变量交互作用引起的离差平方和,可以用来描述变 量之间是否存在协同效应或交互;Q3则是随机扰动,用于反映结果受随机影响的程度。

1.1.6相关系数

常见的有皮尔逊相关系数以及斯皮尔曼相关系数,对应的相关系数计算公式如下:

一般认为相关系数大于0.7时就具备比较强的相关性了,0.9以上相关性非常强。但是否真的存在相关关 系仍然可以通过假设检验的手法去证明。

二、机器学习(教程中的方法还是比较全面的还没有学完,因此这里就先列出一般的机器学习的步骤,后面有时间再把每一个具体方法补上)

机器学习通常解决以下四个问题:分类,回归,聚类,降维

机器学习的一般步骤为:

 (PS:该流程图来源于该链接)http://t.csdnimg.cn/XAc85icon-default.png?t=N7T8http://t.csdnimg.cn/XAc85

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值