自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 河北高校邀请赛——二手车交易价格预测-Task3 特征工程

河北高校邀请赛——二手车交易价格预测-Task3 特征工程一、特征工程目标二、内容介绍三、代码示例1.导入数据2.删除异常值3.特征构造1) 使用时间2) 城市信息3) 特征统计量4) 数据分桶5) 为LR NN 之类的模型构造特征4.特征筛选1) 过滤式2) 包裹式3) 嵌入式四、经验总结一、特征工程目标对于特征进行进一步分析,并对于数据进行处理。二、内容介绍常见的特征工程包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;

2021-04-19 22:40:15 93

原创 河北高校邀请赛——二手车交易价格预测-Task2 数据分析

河北高校邀请赛——二手车交易价格预测-Task2 数据分析EDA-数据探索性分析一、EDA目标二、内容介绍三、代码示例1.载入各种数据科学以及可视化库2.载入数据1) 载入训练集和测试集2) 简略观察数据(head()+shape)3.总览数据概况1) 通过describe()来熟悉数据的相关统计量2) 通过info()来熟悉数据类型4.判断数据缺失和异常1) 查看每列的存在nan情况2) 查看异常值检测5.了解预测值的分布1) 总体分布概况(无界约翰逊分布等)2) 查看skewness and kurto

2021-04-16 23:10:19 228

原创 河北高校邀请赛——二手车交易价格预测-Task1 赛题理解

河北高校邀请赛——二手车交易价格预测-Task1 赛题理解一、赛题背景二、数据概况三、评价指标四、代码示例1.数据读取pandas2.分类指标评价计算示例3.回归指标评价计算示例五、结果提交一、赛题背景赛题:零基础入门数据挖掘 - 二手车交易价格预测要求参赛选手根据给定的数据集,建立模型,预测二手汽车的交易价格。赛题分析:此题为传统的数据挖掘问题,通过数据科学以及机器学习深度学习的办法来进行建模得到结果。此题是一个典型的回归问题。主要应用xgb、lgb、catboost,以及pandas、n

2021-04-13 15:11:35 205

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除