自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 特征工程

特征工程是指将数据转换为能更好地表示潜在问题地特征,从而提高机器学习性能的一类方法。其步骤大致可分为数据理解、数据清洗、特征构造、特征选择,以及类别极端不平衡时的处理。数据理解数据理解阶段的目的是探索数据,了解数据,主要在EDA阶段完成。定性数据:主要为描述性质。可细分为定类和定序工作。定类即按名称分类的数据,如血型和城市等;定序即数据类型有排序之分,如成绩等级(A、B、C)等。定量数据...

2020-03-27 21:29:04 115

原创 数据挖掘EDA学习

数据挖掘EDA学习这两天课比较多,先搭上框架,更多的拓展会在后续补充。EDA的目标EDA的目标主要在于对数据集进行一个初步了解与处理,了解数据各个维度之间的相互关系以及维度与预测值之间的存在关系,对数据进行简单的分析处理和特征工程处理,使数据集的结构和特征集为预测问题的准确性更加可靠。大体内容载入各种数据科学以及可视化库:数据科学库 pandas、numpy、scipy ;可视化库 ...

2020-03-24 11:00:27 123

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除