Datawhale开源学习
文章平均质量分 73
hhhhhxin
这个作者很懒,什么都没留下…
展开
-
Task05 模型融合
DataWhale组队学习打卡第五阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号模型融合模型融合类型方式:简单加权融合:回归:算数平均融合,几何平均融合分类:投票综合:排序融合,log融合boosting/bagging:多树的提升方法stacking/blending:构建多层模型,并利用预测结果再拟合预测简单加权融合平均法回归问题,将多个模型的回归结果去平均值作为预测结果原创 2021-04-25 00:24:11 · 143 阅读 · 0 评论 -
Task04 模型建立
DataWhale组队学习打卡第二阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号模型建立模型的建立要定义模型的结构和目标,增加响应建模,考虑模型的稳定性,以及通过预测模型、剖析模型来讨论模型的稳定性。这里学了随机森林、lightGBM、Xgboost三种模型的使用随机森林随机森林通过集成学习的思想,把多颗决策树集成的算法。其每一颗决策树都是一个分类器,对于一个输入样本,n棵树就会有n种分类结果原创 2021-04-22 23:53:45 · 186 阅读 · 0 评论 -
Task03 特征工程
DataWhale组队学习打卡第二阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号特征工程概论特征工程(Feature Engineering)是数据挖掘模型开发中最耗时、最重要的一步。特征工程是很繁琐但同时也很重要的一个步骤。特征工程分为特征处理和特征选择。特征工程做的好,不仅后期的模型调参容易得多甚至不需要调参,而且模型的稳定性,可解释性也要更好。如果特征工程没做好,模型评估怎么调参都调不到理想原创 2021-04-21 00:18:54 · 157 阅读 · 0 评论 -
Task02 数据分析
DataWhale组队学习打卡第二阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号学习目标:通过数据分析达到熟悉数据的目的,为后面的特征工程做准备。EDA的主要价值在于熟悉数据集的基本情况,包括缺失值,异常值检查,来保证所得的数据集可以在接下来的训练中正常使用。了解特征间的相关性,分布,以及特征与预测值之间的关系。学习内容:1、读取数据集2、大概了解数据特征3、数据可视化打卡学习:学习原创 2021-04-17 00:50:03 · 95 阅读 · 0 评论 -
Task01 地理数据分析常用工具学习
DataWhale组队学习打卡第一阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号学习目标:1.在正式学习之前解读智慧海洋建设赛题的题意,知道其2.通过运行代码熟悉shapely和geopandas两个库的基本使用,理解与区分出两个库在实现几何对象之间的空间操作方法的差别。3.通过网上的代码示例掌握folium和keplergl两种数据可视化工具的使用。4.学习geohash编码方法,理解其推导原创 2021-04-15 00:16:20 · 112 阅读 · 0 评论 -
数据可视化工具folium与kepler.gl的使用以及geohash编码方法的学习
DataWhale组队学习打卡第一阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号geopandas库的学习记录:准备工作from shapely import geometry as geofrom shapley import wktfrom shapley import opsimport numpy as npshapely几何对象的创建及可视化创建的几何对象可以为Point(原创 2021-04-14 23:41:45 · 931 阅读 · 0 评论 -
geopandas库的基础学习
DataWhale组队学习打卡第一天学习目标:1.在正式学习之前解读智慧海洋建设赛题的题意,知道其2.通过运行代码熟悉shapely和geopandas两个库的基本使用,理解与区分出两个库在实现几何对象之间的空间操作方法的差别。3.通过网上的代码示例掌握folium和keplergl两种数据可视化工具的使用。4.学习geohash编码方法,理解其推导过程。学习内容:1、shapely库的基本使用2、 geopandas库的基本使用2、geopandas库的基本使用...原创 2021-04-14 21:51:32 · 1151 阅读 · 1 评论 -
shapely库的基础学习
DataWhale组队学习打卡第一天学习目标:1.在正式学习之前解读智慧海洋建设赛题的题意,知道其2.通过运行代码熟悉shapely和geopandas两个库的基本使用,理解与区分出两个库在实现几何对象之间的空间操作方法的差别。3.通过网上的代码示例掌握folium和keplergl两种数据可视化工具的使用。4.学习geohash编码方法,理解其推导过程。学习内容:1、shapely库的基本使用例如:1、 搭建 Java 开发环境2、 掌握 Java 基本语法3、 掌握条件语句4、原创 2021-04-14 20:26:27 · 1857 阅读 · 0 评论