自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Boosting树 — 模型调参分析

XGBoost前言Q&A:XGBoost需要特征工程吗?XGBoost对于特征变换(离散化、归一化、标准化、取log等),不需要做太多,因为XGBoost是基于决策树,决策树自然能够解决这些。相比较来说,线性模型则需要做离散化或者取log处理。因为XGBoost(树类模型)不依赖于线性假设。XGBoost也可以免于一部分特征合成的工作,比如线性回归中的交互项a:b,在树类模型...

2020-04-02 18:08:15 573

原创 零基础入门数据挖掘-Task3 特征工程

Datawhale 零基础入门数据挖掘-Task3 特征工程前言数据分析总结参考关于 Datawhale前言零基础入门数据挖掘-Task1 赛题理解时间:2020.03.24数据分析内容介绍常见的特征工程包括:异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断;特征归一化/标准化: 标准化...

2020-03-29 22:02:29 461

原创 XGBoost 和 CatBoost 安装

机器学习库安装版本Python版本:3.7Windows版本:Win10问题Python中安装LightGBM时,输入!pip install lightgbm,一切正常,但是安装XGBoost时报错如下:ReadTimeoutError:HTTPSConnectionPool(host='files.pythonhosted.org',port=443): Read timed ...

2020-03-26 19:31:55 2057

原创 零基础入门数据挖掘-Task2 数据分析

Datawhale 零基础入门数据挖掘-Task2 数据分析前言数据分析关于 Datawhale前言零基础入门数据挖掘-Task1 赛题理解时间:2020.03.24数据分析数据分析,分析什么?需要先对数据有一个整体的把握。对于我这个新手来说,暂时把握不了。当然,套路还是要走一走的,例如:# 导入数据path = r'D:/testPython/zero_is_start/'tr...

2020-03-24 21:51:07 293

原创 零基础入门数据挖掘-Task1 赛题理解

Datawhale 零基础入门数据挖掘-Task1 赛题理解前言数据概况预测指标分析赛题代码实现经验总结关于 Datawhale前言赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/information时间:2020.03.21数据概况数据:训练集 - 15万;测试集A...

2020-03-21 18:36:27 577

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除