特征工程
特征工程
珞沫
欲望以提升热忱,毅力以磨平高山。
展开
-
机器学习笔记七——特征工程之特征处理
特征处理1、特征编码2、特征缩放1、特征编码2、特征缩放原创 2020-06-12 17:54:40 · 3948 阅读 · 0 评论 -
机器学习笔记六——特征工程之数据预处理
特征工程之数据预处理1 处理缺失值2 处理异常值2.1 异常值检测2.2异常值处理3 处理类别不平衡问题4 图片数据扩充5 数据的特征表示数据预处理首先需要对数据进行预处理,一般常用的两种数据类型:结构化数据。 结构化数据可以看作是关系型数据库的一张表,每列都有清晰的定义,包含了数值型和类别型两种基本类型;每一行数据表示一个样本的信息。非结构化数据。 主要是文本、图像、音频和视频数据,其包含的信息无法用一个简单的数值表示,也没有清晰的类别定义,并且每个数据的大小互不相同。1 处理缺失值原创 2020-06-12 17:49:27 · 4735 阅读 · 0 评论 -
特征工程
特征工程特征工程类别特征特征编码处理大量的类别特征数字特征文本特征特征工程本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。类别特征类别特征,见名思义,就是用来表达一种类别或标签特征编码分类变量的类别通常不是数字,需要使用编码方法将这些非数字类别变为数字。One-hot 编码每个特征取值对应一维特征,从而得到稀疏的特征矩阵。一个绝对的具有k个可能类别的变...原创 2020-03-28 17:43:17 · 613 阅读 · 0 评论