![](https://img-blog.csdnimg.cn/20190927151053287.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Sklearn
本系列教程旨在提供一个直观、快速的入门指引,从应用的角度进行阐述,提供框架性的理解方式。
全程共5篇教程。若抛开下载和安装的过程,应在2小时左右全部阅读和动手测试完成。
半个冯博士
这个作者很懒,什么都没留下…
展开
-
sklearn快速入门教程 -- 机器学习工具的快速入门指引
本系列教程旨在提供一个直观、快速的入门指引,从应用的角度进行阐述,提供框架性的理解方式。全程共5篇教程。若抛开下载和安装的过程,应在2小时左右全部阅读和动手测试完成。(一)准备工作(二)线性回归(三)机器学习的通用模式及实现方法(四)模型自动调参(五)集成学习...原创 2020-07-26 01:13:58 · 3736 阅读 · 0 评论 -
sklearn快速入门教程:(一)准备工作
sklearn快速入门教程 – 准备工作1. 前言sklearn全称 scikit-learn,大致意思是"science toolkit of machine learning(科学工具库之机器学习)"(我猜的,哈哈哈。)这不重要,重要的是它是一个集成了目前市面上最常用的机器学习模型的库,使用起来非常轻松简单,因此获得了广泛的应用。这个工具箱在2011年发布,并且在机器学习顶级杂志 Journal of Machine Learning Research 发表了对应的论文。能在JMLR上发文章就已原创 2020-07-05 23:39:43 · 4892 阅读 · 0 评论 -
sklearn快速入门教程:(二)线性回归
文章目录一、从本文起学会快速阅读和学习二、线性回归的原理回顾及官方文档三、官方文档的分析四、举一反三五、小结一、从本文起学会快速阅读和学习本来是想把关于快速阅读的说明写在前一节,但最后还是觉得放在这个例子里面更加妥当。首先要明确一点:快速阅读绝不等于读得快!真正的快速阅读实际上是明确阅读的要点,把最多的精力放在最重要的地方去细读;同时果断地减少甚至舍弃对不重要的点的阅读。比如有的文档可能有2000个单词,但实际上真正有用的部分就只有200词。如果只给你10分钟的时间,你去搞明白这200词的内容实际上并原创 2020-07-06 00:50:25 · 3388 阅读 · 0 评论 -
sklearn快速入门教程:(三)机器学习的通用模式及实现方法
一、从线性回归总结机器学习的通用模式从上篇博客我们详细讲述了线性回归的实现方式。线性回归的调用方式实际上是sklearn的典型方式,在掌握这个方法之后我们继续进一步深入,探索其它的模型的使用。回顾线性回归的理论,它实际上还可以写成一个更为抽象的形式:y=f(w;x)y = f(w;x)y=f(w;x)事实上,所有机器学习本质上就是在想办法利用样本数据去拟合一个形如上式的函数关系。对于线性回归,上述函数是一个线性函数,而其它非线性模型则是拟合一个非线性函数。比如logistic回归则是一个logi原创 2020-07-06 13:33:54 · 2738 阅读 · 0 评论 -
sklearn快速入门教程:(四)模型自动调参
sklearn快速入门教程–(四)模型自动调参上个教程中我们已经看到在sklearn中调用机器学习模型其实非常简单。但要获得较好的预测效果则需要选取合适的超参数。在实际的项目中其实也有不少参数是由工程师借助其经验手动调整的,但在许多场景下这种方式仍然是很难行得通的。sklearn提供了十分简单易用的调参方法,可以轻松地实现对各类模型的调参。但调参的机制中涉及的概念相对较多,因此本文需要罗列一些必要的原理。一、 调参的基本思想–交叉验证(Cross Validation)根据上篇教程的内容我们容易想到,原创 2020-07-06 16:41:43 · 9387 阅读 · 5 评论 -
sklearn快速入门教程:(五)集成学习
sklearn快速入门教程–(五)集成学习一、集成学习简述集成学习是目前各类竞赛和工程中应用最广泛的模型提升方法。比如在kaggle中就有关于集成学习的介绍(Kaggle模型融合原文)。这里所谓的模型融合实际上主要就是集成学习方法。常见的集成学习有以下几种:BoostingBaggingStacking其中boosting和bagging应用最多。比如目前流行的xgboost就是(gradient)boosting的一种,而random forest则是bagging的一种。二、集成学习原创 2020-07-11 22:03:53 · 5164 阅读 · 0 评论 -
sklearn快速入门教程:补充内容 -- sklearn模型评价指标汇总(聚类、分类、回归)
sklearn集成了大多数模型评价指标,这可以很大程度上方便我们的使用,尤其在对进行进行自动调参时可以方便我们进行选择。做下这个笔记主要是为了补充之前的内容:sklearn快速入门教程:(四)模型自动调参后续如果有时间可能会把具体的指标公式全部转过来,方便查看。ScoringFunctionCommentClassification‘accuracy’metrics.accuracy_score‘balanced_accuracy’metrics.原创 2020-08-05 11:25:32 · 584 阅读 · 0 评论