数据挖掘
TccccD
这个作者很懒,什么都没留下…
展开
-
数据挖掘实践与我的想法之特征工程
从一个最近的天池数据挖掘比赛--商铺定位赛,记录部分特征工程实践内容。 本博客采用二分类XGBOOST模型,同时涉及部分的多分类模型。原创 2017-11-29 14:58:54 · 3632 阅读 · 0 评论 -
机器学习笔记:回归树
回归树:优点:可以对复杂和非线性的数据建模 缺点:结果不易理解 适用数据类型:数值型和标称型原创 2018-01-11 19:16:35 · 685 阅读 · 0 评论 -
用Python进行数据挖掘(数据预处理)
用Python进行数据挖掘(数据预处理)本博客进行数据预处理的方法总结自kaggle的几道题目: 1.HousePrices 2.Titanic 以及比较不错的几个kernels: 1.https://www.kaggle.com/pmarcelino/house-prices-advanced-regression-techniques/comprehensive-data-explora原创 2017-08-27 19:42:23 · 113933 阅读 · 8 评论 -
GBDT与XGBOOST的联系和区别
最近翻阅了一些介绍GBDT与XGBOOST的原理的博客和论文,网上以及有很多介绍它们的文章了,但博主还是想记录一下它们的原理以及自己的理解,即是方便自己翻阅复习也是希望大佬们提提建议。GBDTGBDT即是Gradient Boosting Tree(梯度提升树),很容易联想到的是这里的梯度提升与Gradient Descend(梯度下降)之间的关系。不去理解这个“Boosting ”,原创 2018-01-03 12:30:33 · 14282 阅读 · 3 评论 -
机器学习-数据挖掘-千千问------更新时间 2018.3.23
问项目谈谈你最熟的或者做的时间最长的项目描述项目解决的问题描述数据挖掘竞赛解决的问题描述对问题的分析描述解决方案的流程,数据挖掘的流程怎么做特征工程的 数据预处理的方法有哪些 归一化标准化方法有哪些对缺失值处理方法有哪些对项目的数据做了哪些处理怎么提取特征的,提取特征的方法提取了多少特征,特征的维度,哪些特征比较好对特征的评估方法是什么,怎么判断其好坏用了什么模型 ...原创 2018-03-23 19:21:40 · 493 阅读 · 2 评论