自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 问答 (1)
  • 收藏
  • 关注

原创 特征处理实践

数值型特征 1、onehotencoder 现实情况下公司存在很多的类别特征,无论是地域类别、商品类别都是利用ID与类别映射的关系,如可能在地域类别特征中(1->’北京’,2->’上海’)。由于机器学习中的很多模型都是对数字敏感的,这些特征的显示意义只是单纯的作为类别标识,并不具有数学上的大小关系,而将上面描述的地域特征(1->’北京’,2->’上海’)模型可能会觉得‘上海’比‘北京’要大,这

2017-08-15 11:24:23 561

原创 【初学者视角】线性回归实践

线性回归是基于误差是正态分布的假设假设样本特征与目标结果成线性关系,利用初中线性方程:y=ax+by=ax+b ,引入基本概念: 自变量:xx是自变量,对应实际问题中的特征,一般特征有多维,所以实际中一般标识为(x1,x2,x3....xn)(x_1,x_2,x_3....x_n),其中x1,x2,x3....xnx_1,x_2,x_3....x_n对应现实中的每个特征 因变量:目标yy是根据自变量

2017-08-02 17:45:18 480

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除