自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 实训日志 7 黄歆-2021.6.7

2C ---- 面向过程、编译型、运行速度快、发布编译后的程序、无需发布源码;java ---- 面向对象、编译型和解释型之间,速度一般;python ---- 面向对象、解释型;缺点:运行速度慢、必须将源码发布出去优点:优雅、内置电池、丰富的三方库3python运行方式:交互式运行方式文件运行方式python解释器:Cpython:c>>>Ipython:[in]:pypyjpythonicorpythonpython命名规则:总规则:字母、数字、下划

2021-06-07 20:57:08 973 1

原创 Task05 模型融合

DataWhale组队学习打卡第五阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号模型融合模型融合类型方式:简单加权融合:回归:算数平均融合,几何平均融合分类:投票综合:排序融合,log融合boosting/bagging:多树的提升方法stacking/blending:构建多层模型,并利用预测结果再拟合预测简单加权融合平均法回归问题,将多个模型的回归结果去平均值作为预测结果

2021-04-25 00:24:11 146

原创 Task04 模型建立

DataWhale组队学习打卡第二阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号模型建立模型的建立要定义模型的结构和目标,增加响应建模,考虑模型的稳定性,以及通过预测模型、剖析模型来讨论模型的稳定性。这里学了随机森林、lightGBM、Xgboost三种模型的使用随机森林随机森林通过集成学习的思想,把多颗决策树集成的算法。其每一颗决策树都是一个分类器,对于一个输入样本,n棵树就会有n种分类结果

2021-04-22 23:53:45 187

原创 Task03 特征工程

DataWhale组队学习打卡第二阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号特征工程概论特征工程(Feature Engineering)是数据挖掘模型开发中最耗时、最重要的一步。特征工程是很繁琐但同时也很重要的一个步骤。特征工程分为特征处理和特征选择。特征工程做的好,不仅后期的模型调参容易得多甚至不需要调参,而且模型的稳定性,可解释性也要更好。如果特征工程没做好,模型评估怎么调参都调不到理想

2021-04-21 00:18:54 157

原创 Task03 天池龙珠计划训练营python学习笔记

本学习笔记为阿里云天池龙珠计划python训练营的学习内容,学习链接为:天池龙珠计划python训练营学习内容:python训练巩固基础:函数lambda-表达式类与对象魔法方法函数:函数定义定义函数对象一般形式如下:函数定义关键词为def;函数定义内容以缩进格式区分;return 表示结束函数,并选择性地返回一个值给调用方。可以省略return语句,默认return Nonedef by_order(): return 5函数调用定义好的函数,直接用函数名调用

2021-04-18 23:22:58 126

原创 Task02 数据分析

DataWhale组队学习打卡第二阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号学习目标:通过数据分析达到熟悉数据的目的,为后面的特征工程做准备。EDA的主要价值在于熟悉数据集的基本情况,包括缺失值,异常值检查,来保证所得的数据集可以在接下来的训练中正常使用。了解特征间的相关性,分布,以及特征与预测值之间的关系。学习内容:1、读取数据集2、大概了解数据特征3、数据可视化打卡学习:学习

2021-04-17 00:50:03 95

原创 Task02 天池龙珠计划训练营python学习笔记

本学习笔记为阿里云天池龙珠计划python训练营的学习内容,学习链接为:天池龙珠计划python训练营学习内容:python训练巩固基础:python的数据序列有序序列的索引下标都是从0开始列表:1、列表的定义2、 列表添加3、 列表列表定义定义列表对象一般形式如下:a=[] #定义空列表ab=list(range(5)) #用迭代器返回数据定义列表bc=b*2 #c中数据指向为b中数据多重复一次,b中数据更改,c的数据也会跟着改d=[1,'asa',[1,'asfda']

2021-04-15 23:55:13 91

原创 Task01 地理数据分析常用工具学习

DataWhale组队学习打卡第一阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号学习目标:1.在正式学习之前解读智慧海洋建设赛题的题意,知道其2.通过运行代码熟悉shapely和geopandas两个库的基本使用,理解与区分出两个库在实现几何对象之间的空间操作方法的差别。3.通过网上的代码示例掌握folium和keplergl两种数据可视化工具的使用。4.学习geohash编码方法,理解其推导

2021-04-15 00:16:20 112

原创 数据可视化工具folium与kepler.gl的使用以及geohash编码方法的学习

DataWhale组队学习打卡第一阶段内容本学习笔记为Datawhale开源学习训练营21年4月数据挖掘学习的学习内容,学习链接为:团队学习数据挖掘/智慧海洋所在学习小组:梅利号geopandas库的学习记录:准备工作from shapely import geometry as geofrom shapley import wktfrom shapley import opsimport numpy as npshapely几何对象的创建及可视化创建的几何对象可以为Point(

2021-04-14 23:41:45 932

原创 geopandas库的基础学习

DataWhale组队学习打卡第一天学习目标:1.在正式学习之前解读智慧海洋建设赛题的题意,知道其2.通过运行代码熟悉shapely和geopandas两个库的基本使用,理解与区分出两个库在实现几何对象之间的空间操作方法的差别。3.通过网上的代码示例掌握folium和keplergl两种数据可视化工具的使用。4.学习geohash编码方法,理解其推导过程。学习内容:1、shapely库的基本使用2、 geopandas库的基本使用2、geopandas库的基本使用...

2021-04-14 21:51:32 1155 1

原创 shapely库的基础学习

DataWhale组队学习打卡第一天学习目标:1.在正式学习之前解读智慧海洋建设赛题的题意,知道其2.通过运行代码熟悉shapely和geopandas两个库的基本使用,理解与区分出两个库在实现几何对象之间的空间操作方法的差别。3.通过网上的代码示例掌握folium和keplergl两种数据可视化工具的使用。4.学习geohash编码方法,理解其推导过程。学习内容:1、shapely库的基本使用例如:1、 搭建 Java 开发环境2、 掌握 Java 基本语法3、 掌握条件语句4、

2021-04-14 20:26:27 1860

原创 Task01 天池龙珠计划训练营python学习笔记

本学习笔记为阿里云天池龙珠计划python训练营的学习内容,学习链接为:天池龙珠计划python训练营学习内容:python训练巩固基础1、 条件与循环2、 异常处理条件与循环:1、if条件语句2、 if-else条件语句3、 if-elif-else条件语句条件语句if语句一般形式如下:if condition_1: statement_block_1elif condition_2: statement_block_2else: statement

2021-04-12 23:54:52 107

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除