![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 96
X0420C
这个作者很懒,什么都没留下…
展开
-
河北高校邀请赛——二手车交易价格预测-Task3 特征工程
河北高校邀请赛——二手车交易价格预测-Task3 特征工程一、特征工程目标二、内容介绍三、代码示例1.导入数据2.删除异常值3.特征构造1) 使用时间2) 城市信息3) 特征统计量4) 数据分桶5) 为LR NN 之类的模型构造特征4.特征筛选1) 过滤式2) 包裹式3) 嵌入式四、经验总结一、特征工程目标对于特征进行进一步分析,并对于数据进行处理。二、内容介绍常见的特征工程包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;原创 2021-04-19 22:40:15 · 93 阅读 · 0 评论 -
河北高校邀请赛——二手车交易价格预测-Task2 数据分析
河北高校邀请赛——二手车交易价格预测-Task2 数据分析EDA-数据探索性分析一、EDA目标二、内容介绍三、代码示例1.载入各种数据科学以及可视化库2.载入数据1) 载入训练集和测试集2) 简略观察数据(head()+shape)3.总览数据概况1) 通过describe()来熟悉数据的相关统计量2) 通过info()来熟悉数据类型4.判断数据缺失和异常1) 查看每列的存在nan情况2) 查看异常值检测5.了解预测值的分布1) 总体分布概况(无界约翰逊分布等)2) 查看skewness and kurto原创 2021-04-16 23:10:19 · 228 阅读 · 0 评论 -
河北高校邀请赛——二手车交易价格预测-Task1 赛题理解
河北高校邀请赛——二手车交易价格预测-Task1 赛题理解一、赛题背景二、数据概况三、评价指标四、代码示例1.数据读取pandas2.分类指标评价计算示例3.回归指标评价计算示例五、结果提交一、赛题背景赛题:零基础入门数据挖掘 - 二手车交易价格预测要求参赛选手根据给定的数据集,建立模型,预测二手汽车的交易价格。赛题分析:此题为传统的数据挖掘问题,通过数据科学以及机器学习深度学习的办法来进行建模得到结果。此题是一个典型的回归问题。主要应用xgb、lgb、catboost,以及pandas、n原创 2021-04-13 15:11:35 · 205 阅读 · 0 评论