常用的统计模型

1.广义线性模型(是多数监督机器学习方法的基础,如逻辑回归和Tweedie回归)

2.时间序列方法(ARIMA ,SSA,基于机器学习的方法)

3.结构方程建模(针对潜变量之间关系进行建模)

4.因子分析(调查设计和验证的探索型分析)

5.功效分析/实验分析(特别是基于仿真的实验设计,以避免分析过度)

6.非参数检验(MCMC)
7.K均值聚类

8.贝叶斯方法(朴素贝叶斯、贝叶斯模型平均/Bayesian model averaging、贝叶斯适应型实验/Bayesian adaptive trials)

9.惩罚性回归模型(弹性网络/Elastic Net,LASSO,LARS),以及对通用模型(SVM\XGboost等)加惩罚,这对于预测变量多与观测值的数据很有用,在基因组学和社会科学研究中较为常用。

10.样条模型/SPline-based models(MARS等):主要用于流程建模。

11.马尔可夫链和随机过程(时间序列建模和预测建模的替代方法)

12.缺失数据插补方法及其假设(missFores,MICE)

13.生存分析/survival analysis(主要特点是考虑了每个观测出现某一结局的时间长短)

14.混合建模

15.统计推理和组群测试

建议读者根据自己所学领域重点学习面向特定领域的专用模型

##以上内容均来自《python 编程从数据分析到数据科学》

Python中常用统计模型有很多,以下是其中几个常见的: 1. 线性回归模型(Linear Regression):用于建立自变量和因变量之间的线性关系,并进行预测和解释。在Python中,可以使用scikit-learn库中的LinearRegression类来实现。 2. 逻辑回归模型(Logistic Regression):用于建立自变量和二分类因变量之间的关系,并进行分类预测。在Python中,可以使用scikit-learn库中的LogisticRegression类来实现。 3. 决策树模型(Decision Tree):用于建立自变量和因变量之间的非线性关系,并进行分类或回归预测。在Python中,可以使用scikit-learn库中的DecisionTreeClassifier和DecisionTreeRegressor类来实现。 4. 随机森林模型(Random Forest):是一种集成学习方法,通过组合多个决策树模型来提高预测准确性。在Python中,可以使用scikit-learn库中的RandomForestClassifier和RandomForestRegressor类来实现。 5. 支持向量机模型(Support Vector Machine):用于建立自变量和因变量之间的非线性关系,并进行分类或回归预测。在Python中,可以使用scikit-learn库中的SVC和SVR类来实现。 6. 聚类模型(Clustering):用于将数据集划分为不同的组或簇,使得同一组内的数据相似度较高,不同组之间的数据相似度较低。在Python中,可以使用scikit-learn库中的KMeans和DBSCAN类来实现。 7. 主成分分析模型(Principal Component Analysis):用于降低数据维度,并提取出最重要的特征。在Python中,可以使用scikit-learn库中的PCA类来实现。 8. 时间序列模型(Time Series):用于分析和预测时间序列数据,如股票价格、气象数据等。在Python中,可以使用statsmodels库和Prophet库来实现时间序列分析和预测。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值