数据竞赛
文章平均质量分 50
右禺
这个作者很懒,什么都没留下…
展开
-
房价租金预测竞赛总结3:特征工程
房价租金预测竞赛总结3:特征工程前言导入包和数据特征合并计算统计特征groupby方法生成统计特征聚类方法log平滑特征选择相关系数法wrapperEmbedded基于惩罚项的特征选择法基于树模型的特征选择法前言在上一篇中,我们对于缺失值、异常值以及按照‘region’对数据进行深度清理。在本篇博文就是基于上一篇数据清理工作基础上将对特征进行合并和选择。导入包和数据import warni...原创 2020-01-12 22:31:21 · 362 阅读 · 0 评论 -
房价租金预测竞赛总结2:数据清洗
房价租金预测竞赛总结2:数据清洗前言导入包与数据缺失值处理异常值处理深度清洗前言在上一篇中,我们对于赛题、数据总体情况、缺失值、特征分布等信息做了简要的分析。在本篇博文就是基于上一篇的数据分析做数据清理工作。在一些场景中,数据分析和数据清洗合并起来会被称作EDA(Exploratory Data Analysis-探索性数据分析)。当然真正的EDA包含的内容远不止这两篇博文所展示的内容,大家...原创 2020-01-09 23:44:42 · 384 阅读 · 0 评论 -
房价租金预测竞赛总结1:数据探索性分析
房价租金预测竞赛总结1:数据探索性分析任务要求数据概况数据集字段说明评分指标数据分析总体情况类别特征和数值特征缺失值分析单调特征列分析特征unique分析统计特征值频次大于100的特征label分布编码问题任务要求比赛要求参赛选手根据给定的数据集,建立模型,预测房屋租金。赛题连接:房价租金预测数据概况数据集中的数据类别包括租赁房源、小区、二手房、配套、新房、土地、人口、客户、真实租金等。...原创 2020-01-07 17:01:45 · 720 阅读 · 1 评论