![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
xylbill97
Good Good Study
展开
-
Python 模型保存和加载的两种方法:joblib库和pickle模块
Python 模型保存和加载的两种方法:joblib库和pickle模块原创 2020-11-20 19:51:58 · 1365 阅读 · 0 评论 -
集成学习(“森林书”)之三大集成方法Boosting、Bagging、Stacking
最近入手了周志华老师的《集成学习:基础与算法》一书,对书中介绍的目前常用的三大集成方法Boosting、Bagging、Stacking进行了学习。这篇博客主要是对这三大集成思想的一些总结,不涉及理论层面的推导。原创 2020-09-26 16:36:32 · 2272 阅读 · 1 评论 -
数学建模神器——Facebook时间序列预测库Prophet
最开始先交代点背景:这几天都一直在忙着做学校研究生数学建模的选拔赛,题目是2020年MathorCup高校数学建模挑战赛B题,有兴趣的童鞋可以去看看哈,主要大概就是研究关于国家养老服务床位未来的发展趋势(本身题目里没有给足够多的数据,所以需要自己动手搜集,令人头大)。本来最开始想到的是灰色预测或者ARIMA时间序列模型,结果无意之中发现了非常强大的Facebook开源的Prophet时间序列预测工具,操作简单,所以特别写了这篇博客总结下Prophet的原理、安装和使用。本文目录一、Prophet算法的.原创 2020-07-13 10:08:10 · 1442 阅读 · 1 评论 -
sklearn库之交叉验证与网格搜索
文章目录一、交叉验证(主要用到sklearn.model_selection)1.1 k 折交叉验证1.2 分层k折交叉验证1.3 其他策略二、网格搜索2.1 简单网格搜索: 遍历法2.2 引入验证集2.3 带交叉验证的网格搜索2.4 其他情况三、评估指标与评分(主要用到sklearn.metrics)3.1 二分类指标(本节重点)3.2 多分类指标3.3 回归指标3.4 在模型选择中使用评估指标四、总结主要内容用途交叉验证一种更可靠的评估泛化性能的方法网格原创 2020-05-09 09:53:20 · 1845 阅读 · 1 评论 -
sklearn库之数据表示与特征工程
本文主要包含两大部分,第1部分为对特征数据的变换,尤其对复杂度较低的模型,例如线性模型非常有用,第2部分为特征选择。文章目录一、分类变量1.1 One-Hot编码(虚拟变量)1.2 数字编码的分类变量如何处理?二、分箱(离散化):主要针对线性模型三、交互特征与多项式特征四、单变量非线性变换part1总结五、自动化特征选择(主要用到sklearn.feature_selection)5.1 单...原创 2020-05-06 12:02:05 · 525 阅读 · 0 评论 -
sklearn库之监督实习——k近邻和线性模型
文章目录一、如何处理数据集?二、如何调用算法?三、监督学习:分类与回归四、主要算法4.1 使用到的数据集4.2 k近邻4.3 线性模型4.4 朴素贝叶斯分类器一、如何处理数据集?from sklearn.dataset import load_iris # 加载鸢尾花数据集 使用scikit-learn时,数据通常用大写的 X 表示,而标签用小写的 y 表示。scikit-learn的...原创 2020-05-01 14:48:26 · 722 阅读 · 1 评论