数据挖掘
皓月Moon
这个作者很懒,什么都没留下…
展开
-
Pandas学习--分组部分
注:本博客跟随此Pandas教程进行学习,有兴趣可以学习一下。先上一张框架图:理论部分 第3章 分组 一. SAC过程 1.内涵 SAC指的是分组操作中的split-apply-combine过程 其中split指基于某一些规则,将数据拆成若干组,apply是指对每一组独立地使用函数,combine指将每一组的结果组合成某一类数据结构 2.apply过程 在...原创 2020-04-26 23:40:22 · 139 阅读 · 0 评论 -
Pandas学习----索引部分
注:本博客跟随此Pandas教程进行学习,有兴趣可以学习一下。先上一张框架图: 一.单级索引 1.loc方法,iloc方法,【】操作符 loc:标签索引 注意:所有在loc中使用的切片都包含右端点 1.单行索引 2.多行索引 3.单列索引 4.多列索引 5.联合索引 6.函数式索引 7.布尔索引 iloc:位置索引 不包含切片右端点 1.单行索引 2...原创 2020-04-23 22:47:42 · 134 阅读 · 0 评论 -
数据挖掘---模型结果融合
本次学习基于**零基础入门数据挖掘 - 二手车交易价格预测**比赛。本人使用的学习资料请见:https://github.com/datawhalechina/team-learning模型融合类型方式简单加权融合回归(分类概率):算术平均融合,几何平均融合分类:投票综合:排序融合,log融合stacking/blending构建多层模型boosting/bag...原创 2020-04-04 19:35:11 · 232 阅读 · 0 评论 -
数据挖掘---模型构建及预测
本次学习基于**零基础入门数据挖掘 - 二手车交易价格预测**比赛。本人使用的学习资料请见:https://github.com/datawhalechina/team-learning训练及预测的一般流程基础知识个人感觉这个非一日之功,需要不断地去积累,去学习,我只是·在此参考别人的,列一个知识清单吧:统计学习分类1.监督学习线性回归,决策树,SVD等2.非监督学习K-m...原创 2020-04-01 21:20:48 · 3481 阅读 · 0 评论 -
数据挖掘---特征工程学习
本次学习基于**零基础入门数据挖掘 - 二手车交易价格预测**比赛。本人使用的学习资料请见:https://github.com/datawhalechina/team-learning由于本人是第一次真正意义上的参加数据挖掘的比赛,今天以二手车交易价格预测为例分享一下我了解到的有关数据挖掘比赛的规则与流程。总的来说比赛流程可以简单的分为三部分:...原创 2020-03-28 20:50:18 · 90 阅读 · 0 评论 -
数据挖掘---Baseline的建立
本次学习基于**零基础入门数据挖掘 - 二手车交易价格预测**比赛。本人使用的学习资料请见:https://github.com/datawhalechina/team-learning1.数据下载首先在官网下载数据包,下载的数据包分为两大类训练集—15w条数据测试集A—5w条数据另外平台有测试集B(5w条数据)对你提交后的代码进行评估2.数据读取通过Pandas对于数据进行...原创 2020-03-24 21:15:50 · 688 阅读 · 0 评论