![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
智慧海洋
文章平均质量分 93
埋在地里的小土豆
这个作者很懒,什么都没留下…
展开
-
智慧海洋建设-Task5 模型融合
Datawhale 智慧海洋建设-Task5 模型融合 内容介绍 https://mlwave.com/kaggle-ensembling-guide/ https://github.com/MLWave/Kaggle-Ensemble-Guide 模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。. 1.简单加权融合: 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean); 分类:投票(Voting) 2.boosting/bagging原创 2021-04-24 22:49:07 · 223 阅读 · 0 评论 -
智慧海洋建设-Task4模型建立
智慧海洋建设-Task4模型建立 该部分学习如何进行模型的搭建及调参 模型训练与预测 模型训练与预测的主要步骤为: (1):导入需要的工具库 (2):对数据预处理,包括导入数据集、处理数据等操作,具体为缺失值处理、连续特征归一化、类别特征转换等 (3):训练模型。选择合适的机器学习模型,利用训练集对模型进行训练,达到最佳拟合效果。 (4):预测结果。将待预测的数据输入到训练好的模型中,得到预测的结果。 以下是常用几种算法: 随机森林 随机森林是通过集成学习的思想将多棵树集成的一种算法,基本单元是决策树,而它原创 2021-04-23 00:36:04 · 200 阅读 · 0 评论 -
Datawhale 智慧海洋建设-Task3 特征工程
Datawhale 智慧海洋建设-Task3 特征工程 这里说声抱歉,这部分内容对于初学者的我来说难度有些大,内容有点多,只看了大约一半,还有一半会继续学习,待学完会及时补充笔记。 DataWhale 此部分为智慧海洋建设竞赛的特征工程模块,通过特征工程,可以最大限度地从原始数据中提取特征以供算法和模型使用。通俗而言,就是通过X,创造新的X’以获得更好的训练、预测效果。 “数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”——机器学习界; 类似的,吴恩达曾说过:“特征工程不仅操作困难、耗时,原创 2021-04-21 00:17:08 · 348 阅读 · 2 评论 -
Datawhale 智慧海洋建设-Task1
这是在datawhale组织里参加的一个组队学习,内容是海洋数据分析,第一章内容还未学完,后面学习完毕会及时补充整个笔记,这里说声抱歉 DataWahle Datawhale 智慧海洋建设-Task1 地理数据分析常用工具 在地理空间数据分析中,常会用到许多地理分析的工具,在本模块中主要是针对常用的shapely、geopandas、folium、kepler.gl、geohash等工具进行简单介绍 shapely Shapely是python中开源的空间几何对象库,支持Point、Curve和Surfac原创 2021-04-15 00:32:19 · 426 阅读 · 0 评论