统计基础

本文介绍了统计分析中的关键概念,包括相关分析、回归分析、聚类分析和判别分析。相关分析研究变量间的关系;回归分析涉及线性、曲线和逻辑回归;聚类分析涵盖k-means、分层和模糊C均值算法;判别分析包括最大似然法、距离判别和Fisher判别。此外,还提到了贝叶斯判别和主成分、因子分析在简化数据和抓住问题实质上的作用,以及时间序列分析在预测未来趋势的应用。
摘要由CSDN通过智能技术生成

《概率论与数理统计》(完结)《多元回归分析、应用回归分析》《时间序列分析》

3.相关分析:相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。常见的有线性相关分析、偏相关分析和距离分析

5.回归分析:线性回归,曲线回归,二元logistic回归,多元logistic回归。
5.1、线性回归:线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
5.2、曲线回归:两个变数间呈现曲线关系的回归。
5.3、二元logistic回归、多元logistic回归:Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。
因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。

6.聚类分析:主要解决的是在“物以类聚、人以群分”,基于用户间彼此距离的长短来对用户进行聚类划分的方法依然是当前最流行的方法。首先确定选择哪些指标对用户进行聚类;然后在选择的指标上计算用户彼此间的距离,距离的计算公式很多,最常用的就是直线距离(把选择的指标当作维度、用户在每个指标下都有相应的取值,可以看作多维空间中的一个点,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值