特征工程
特征工程入门与实践学习笔记
Campbell001
这个作者很懒,什么都没留下…
展开
-
特征工程(3)特征增强:数据清洗
缺失值识别原创 2020-04-10 09:56:52 · 965 阅读 · 0 评论 -
特征工程(3)特征增强:数据清洗——归一化/标准化
归一化由于机器学习模型收到scale的影响很大,如果有极端离群值可能对某些机器学习算法影响非常大受尺度影响的算法KNN --因为依赖欧几里得距离K均值聚类 – 和KNN一样逻辑回归、SVM、神经网络(如果使用梯度下降来学习权重)主成分分析–特征向量将偏向较大的列归一化将所有定量列转化为同一个静态范围内的值或者使用数据规则:所有列的均值和标准差必须相同标准化通过确...原创 2020-04-10 09:48:42 · 2151 阅读 · 0 评论 -
特征工程(3)特征增强:数据清洗——缺失值处理
上一篇介绍了如何将缺失值识别出来缺失值识别缺失值处理主要的缺失值处理方法:删除缺少值的行填充缺失值数据集说明数据集:皮马印第安人糖尿病预测数据集数据来源:https://www.kaggle.com/uciml/pima-indians-diabetes-database数据9列,768行该数据希望通过体检结果细节,预测21岁以上的女性5年内会否会换上糖尿病数...原创 2020-04-10 09:11:45 · 1045 阅读 · 0 评论 -
特征工程(3)特征增强:数据清洗——缺失值识别
缺失值识别数据集说明数据集:皮马印第安人糖尿病预测数据集数据来源:https://www.kaggle.com/uciml/pima-indians-diabetes-database数据9列,768行该数据希望通过体检结果细节,预测21岁以上的女性5年内会否会换上糖尿病数据含义怀孕次数口服葡萄糖耐量试验中的2小时血浆葡萄糖浓度舒张压(mmHg)三头肌皮褶厚度(mm...原创 2020-04-03 20:12:42 · 1220 阅读 · 0 评论 -
特征工程(1)特征工程的简介
特征工程是什么将数据转换为能更好的表示潜在问题的特征,从而提高机器学习性能特征工程内容转换数据的过程特征工程适用于任何阶段的数据,通常将数据处理成表格形式,数据组织成行(观察值)列(属性)的形式。特征特征是对机器学习的过程有意义的数据属性。无意义的只是普通属性,而有意义的才称之为特征更好的表示潜在问题需要使用的数据代表了某领域内的某问题,转换数据的目的是为了更好的表达更大的问题...原创 2020-03-27 21:55:42 · 1495 阅读 · 0 评论 -
特征工程(2)特征理解
特征理解的基本流程,以及数据的分类,数据的等级分析示例原创 2020-03-30 11:29:41 · 881 阅读 · 0 评论