自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

翻译 Kaggle学习笔记--pandas【未完】

Kaggle学习笔记--pandasPart1基础操作读取csv文件构建Dataframe与Series将dataframe写入csv文件访问某列column的值pandas的访问运算符--loc[:,:]和iloc[:,:]set_index()多条件筛选:isin()notnull()添加/修改值Part2describe()mean() & unique() & value_...

2020-01-17 14:24:58 375

翻译 Kaggle学习笔记--data leakage

Kaggle学习笔记--data leakage简介在本教程中,您将学习什么是数据泄漏以及如何防止数据泄漏目标泄漏——预测变量包含不可用数据训练-测试污染数据准备简介在本教程中,您将学习什么是数据泄漏以及如何防止数据泄漏如果您不知道如何预防,则会经常出现泄漏,并且会以微妙而危险的方式破坏模型。数据泄露会导致模型在训练时高性能,使得结果准确;而在预测时变得效果很差。泄漏有两种主要类型:【t...

2020-01-14 14:49:07 618

翻译 Kaggle学习笔记--XGBoost

Kaggle学习笔记--XGBoost简介XGBoost是什么梯度提升XGBoost是一种通过循环迭代的将模型添加到集合中的方法XGBoost 的优点数据加载步骤1:创建XGBoost模型步骤2:改进模型(1)——获得更低的MAE步骤3:改进模型(2)——获得更高的MAE总结简介XGBoost是什么Xgboost是Boosting算法的其中一种,Boosting算法的思想是将许多弱分类器集成...

2020-01-13 15:33:23 401

翻译 Kaggle学习笔记--Cross-Validation

Kaggle学习笔记--Cross-Validation简介如何使用交叉验证来更好地度量模型性能。什么是交叉验证?什么时候应该使用交叉验证?数据准备步骤1.构造函数使用scikit-learn构建管道。写一个函数——‘使用交叉验证为机器学习模型选择参数’步骤2:测试不同参数的值步骤3:获得最小值--最佳模型简介如何使用交叉验证来更好地度量模型性能。机器学习是一个反复的过程。您将面临选择使用哪...

2020-01-13 10:54:38 333

翻译 Kaggle学习笔记--Pipelines

Kaggle学习笔记--Pipelines简介sklearn.pipeline()处理机制:数据准备步骤1:定义预处理步骤SimpleImputer类处理缺失值ColumnTransformer捆绑预处理步骤步骤3:创建和评估管道kaggle课程连接https://www.kaggle.com/alexisbcook/pipelines.简介sklearn.pipeline()处理机制:P...

2020-01-10 13:15:26 567

翻译 Kaggle学习笔记——Categorical Variables

Kaggle学习笔记--Categorical Variables简介数据准备步骤1:删除包含分类数据的列步骤2:标签编码步骤3:统计基数步骤4:一键编码kaggle课程连接https://www.kaggle.com/learn/intermediate-machine-learning.简介本次练习介绍三种处理数据中的分类变量(即类型为object的变量)的方法。方法一、删除分类变量...

2020-01-09 11:13:42 1057

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除