- 博客(5)
- 收藏
- 关注
原创 Boosting树 — 模型调参分析
XGBoost前言Q&A:XGBoost需要特征工程吗?XGBoost对于特征变换(离散化、归一化、标准化、取log等),不需要做太多,因为XGBoost是基于决策树,决策树自然能够解决这些。相比较来说,线性模型则需要做离散化或者取log处理。因为XGBoost(树类模型)不依赖于线性假设。XGBoost也可以免于一部分特征合成的工作,比如线性回归中的交互项a:b,在树类模型...
2020-04-02 18:08:15 662
原创 零基础入门数据挖掘-Task3 特征工程
Datawhale 零基础入门数据挖掘-Task3 特征工程前言数据分析总结参考关于 Datawhale前言零基础入门数据挖掘-Task1 赛题理解时间:2020.03.24数据分析内容介绍常见的特征工程包括:异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断;特征归一化/标准化: 标准化...
2020-03-29 22:02:29 675
原创 XGBoost 和 CatBoost 安装
机器学习库安装版本Python版本:3.7Windows版本:Win10问题Python中安装LightGBM时,输入!pip install lightgbm,一切正常,但是安装XGBoost时报错如下:ReadTimeoutError:HTTPSConnectionPool(host='files.pythonhosted.org',port=443): Read timed ...
2020-03-26 19:31:55 2161
原创 零基础入门数据挖掘-Task2 数据分析
Datawhale 零基础入门数据挖掘-Task2 数据分析前言数据分析关于 Datawhale前言零基础入门数据挖掘-Task1 赛题理解时间:2020.03.24数据分析数据分析,分析什么?需要先对数据有一个整体的把握。对于我这个新手来说,暂时把握不了。当然,套路还是要走一走的,例如:# 导入数据path = r'D:/testPython/zero_is_start/'tr...
2020-03-24 21:51:07 416
原创 零基础入门数据挖掘-Task1 赛题理解
Datawhale 零基础入门数据挖掘-Task1 赛题理解前言数据概况预测指标分析赛题代码实现经验总结关于 Datawhale前言赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/information时间:2020.03.21数据概况数据:训练集 - 15万;测试集A...
2020-03-21 18:36:27 755
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人