![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
项目学习
文章平均质量分 96
Harold_Ran
这个作者很懒,什么都没留下…
展开
-
2020DCIC智慧海洋建设算法赛学习03-特征工程
序:特征工程往往是算法比赛中最至关重要的一环,一个好的特征工程能够让你的分数有大幅的提升,而如何做好特征工程、从哪些方面入手构建特征就需要经验积累和学习TOP选手的优秀方案。通过学习TOP选手开源代码的特征工程部分,我们可以发现,对于智慧海洋这样一个包含时序和空间信息的赛题,通常可以从以下几方面来构造特征。0 基本预处理在进行特征工程之前,我们需要对原始数据做一些基本的预处理。部分原始训练数据是这样的:通过上一篇博客的数据分析,我们知道数据中没有缺失值,因此不用做缺失值填充。对于这份数据,我们需原创 2021-04-20 22:21:16 · 827 阅读 · 0 评论 -
2020DCIC智慧海洋建设算法赛学习02-数据分析
序:这篇博客旨在对赛题数据做一些初步的探索,包括查看数据中的缺失值、异常值等,以及通过可视化来观察各个特征的分布情况,为之后进行特征工程提供一些思路。1. 查看数据整体情况对于一份数据集,首先要对它的整体情况做一些基本的了解。导入数据库首先导入必要的库:import warningswarnings.filterwarnings('ignore')import numpy as npimport pandas as pdfrom matplotlib import pyplot as原创 2021-04-17 01:36:38 · 1079 阅读 · 3 评论 -
2020DCIC智慧海洋建设算法赛学习01-赛题北京及地理数据分析常用工具
序:本系列的博客旨在学习2020DCIC智能算法赛-智慧海洋建设的优秀方案,对地理数据分析问题积累一些思路和经验。作为这一系列博客的开篇,这篇博客主要内容包括对赛题的解析和对项目中会用到的一些常用的地理数据分析工具的简要介绍。1 赛题背景1.1 问题陈述智慧海洋建设比赛是一个时序数据的分类问题,任务就是要通过给出的渔船轨迹的北斗数据判断渔船的生产作业行为。渔船的生产作业行为包括三类:拖网作业、围网作业和流刺网作业。(1) 拖网作业拖网作业是依靠渔船的动力拖动渔具将所经之处的鱼虾捕捞入网的一种捕原创 2021-04-15 02:51:49 · 947 阅读 · 0 评论 -
Kaggle经典项目——房价预测
写在前面:这篇文章旨在梳理kaggle回归问题的一个基本流程。博主只是一个数据分析刚入门的新手,有些错漏之处还请批评指正。很遗憾这个项目最后提交的Private Score只达到了排行榜的TOP13%,我目前也还没有更好的方法去进一步提高分数,不过整个项目做完之后对kaggle回归预测项目的解题思路有了一套比较完整清楚的认识,总结出来和大家分享,欢迎共同探讨。1.项目背景问题陈述房价预测是kaggle的一个经典Data Science项目,作为数据分析的新手,这是一个很好的入门练习项目。任务很明确原创 2020-07-19 18:35:38 · 45040 阅读 · 43 评论