数据挖掘
数据挖掘竞赛流程-算法-python实现
马房山彭于晏呀~
这个作者很懒,什么都没留下…
展开
-
数据挖掘--树模型融合特征选择
from sklearn.ensemble import RandomForestRegressorfrom sklearn.ensemble import AdaBoostRegressorfrom sklearn.ensemble import ExtraTreesRegressorfrom sklearn.ensemble import GradientBoostingRegresso...原创 2020-03-28 18:18:20 · 624 阅读 · 0 评论 -
机器学习-Catboost
详解参考:https://blog.csdn.net/weixin_43317015/article/details/90212867原创 2020-04-01 18:20:57 · 143 阅读 · 0 评论 -
数据挖掘-Datawhale学习笔记-04-模型融合
常见模型融合方式有blending,bagging ,加权融合stacking模型融合class StackingAveragedModels(BaseEstimator, RegressorMixin, TransformerMixin): def __init__(self, base_models, meta_model, n_folds=10): self.ba...原创 2020-04-04 20:46:32 · 189 阅读 · 0 评论 -
数据挖掘-Datawhale学习笔记-02-特征工程
学习题目:天池-二手车价格预测 https://tianchi.aliyun.com/competition/entrance/231784/information 数据挖掘-特征工程 https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.12.1cd81b438QtUxo&...原创 2020-03-27 17:42:55 · 179 阅读 · 0 评论 -
数据挖掘-Datawhale学习笔记-01-数据分析EDA
前沿: 数据挖掘小白一个,之前也被师兄带着参加过一次数据竞赛,也拿了全国top10,但是多半在划水,对于一个数据挖掘流程还不是特别清晰,通过Datawhale的系统学习,希望可以学到完成的解题流程,为下次比赛打基础。 学习题目:天池-二手车价格预测 数据挖掘-数据分析EDA数据探索性分析EDA通过探索性分析,寻找变量与变量,变量与预测值之间的一些关系分布,为特征工程及...原创 2020-03-23 14:53:42 · 259 阅读 · 0 评论 -
数据清洗处理-常用操作
# 数据清洗常用操作# 重复值处理print('存在' if any(train_data.duplicated()) else '不存在', '重复观测值')train_data.drop_duplicates()#缺失值处理print('存在' if any(train_data.isnull()) else '不存在', '缺失值')train_data.dropna() # ...原创 2020-03-24 15:31:30 · 999 阅读 · 0 评论 -
机器学习评价指标
机器学习中,模型评估指标是指对于一个模型结果的数据型量化分类算法常见评估指标:对于二类分类器/分类算法,评价指标主要有accuracy, [Precision,Recall,F-score,Pr曲线],ROC-AUC曲线。对于多类分类器/分类算法,评价指标主要有accuracy, [宏平均和微平均,F-score]。回归预测类常见的评估指标:平均绝对误差(Mean Absolute Er...原创 2020-03-22 15:18:07 · 244 阅读 · 0 评论