自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 问答 (1)
  • 收藏
  • 关注

原创 机器学习-数据特征预处理

机器学习-数据特征预处理数据的特征预处理对数据进行处理:通过特定的统计方法(数学方法),把数据转换成算法需要的数据。类: sklearn.preprocessing数值型数据:​ 标准缩放: 归一化 标准化 缺失值类别型数据:one-hot编码时间类型: 时间的切分归一化归一化处理:统计人觉得几个特征同等重要时,要用归一化目的:使得一个特征不会对最终结果不会造成更大...

2018-12-03 15:45:09 249

原创 机器学习-特征工程和文本特征提取

机器学习-特征工程和文本特征提取数据集scikit-learn :数据量小,方便学习kaggle: 大数据竞赛平台,真实数据,数据量巨大UCI:收录了360个数据集,覆盖科学、生活、经济等领域,数据量几十万常用数据集数据的结构组成:特征值+目标值特征工程特征工程是什么​ 将原始数据转换为更好的代表预测模型的潜在问题的特征的过程,从而提高了对未知数据预测的准确性特征工程的意义...

2018-12-01 11:26:25 4165 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除