![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 83
G_瑞琴
这个作者很懒,什么都没留下…
展开
-
scikit-learn中的Pipeline
在机器学习项目中,对训练集进行各种数据预处理操作,比如:数据特征提取、标准化、主成分分析等,在测试集上还需重复使用这些参数,我们可以使用机器学习中的pipeline机制来避免重复的操作。示例:数据背景:城市租用自行车计划是在城市中部署若干个自助租车处。在这个由租车处组成的网络中使用者可自助租用、归还自行车。迄今为止,全世界已经有500多个自助自行车租用处。目标:通过给予的历史数据(包括天气、时间、季节等特征)使用Pipeline构建回归模型预测特定条件 下的租车数目加载数据# 加载数据原创 2021-07-22 01:17:27 · 428 阅读 · 0 评论 -
Pyhton——Sklearn基础
Pyhton——Sklearn基础Sklearn 全名叫scikit-learn ,它是一个非常强大的 Python 机器学习算法包,提供了非常完整的机器学习功能,它的功能覆盖了一个非常完善的机器学习流程。sklearn官网(http://scikit-learn.org/)提供的文档非常详细的,我们在学习过程中可查阅相关内容sklearn组成分类 Classification回归 Regression聚类 Clustering降维 Dimensionality reduction模型选原创 2021-07-21 00:44:30 · 224 阅读 · 0 评论 -
机器学习实战——泰坦尼克号
通过泰坦尼克号生存项目来熟悉机器学习的整个流程,数据来源是kaggle上的titanic数据。该项目从数据获取->数据清洗->特征处理->构建模型->模型评估5个步骤进行分析。该比赛提供了891名泰坦尼克号的乘客数据,包含乘客的姓名,性别、年龄、客舱等级等信息,数据中还包含一个最重要的信息:乘客是否生还(1:生还,0:遇难)。目的是通过对训练数据集的学习来构建一个分类预测模型,对测试数据集中的418名乘客生存情况进行预测。数据来源链接:https://www.kaggle原创 2021-07-07 01:47:06 · 7202 阅读 · 6 评论