自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 mnist手写数字识别数据初探

mnist手写数字识别为学习tensorflow等深度学习框架的入门经典数据集,tensorflow有直接加载mnist数据库相关的模块, 其地位类似于使用R语言作数据挖掘中的iris数据集。网络上关于使用mnist数据集实现各类深度学习算法的代码非常多,但是对于初学者而言,依着葫芦画瓢虽然将网上down的代码跑通了,但是对于其中每个步骤或是数据集可能一脸懵逼,下面对该数据集做简要的初步探索。一、...

2018-06-04 17:45:19 514

原创 基于机器学习的高价值用户简历自动分类

基于机器学习的高价值用户简历自动分类一、业务介绍对于任何互联网招聘企业来说,求职者的简历库都是核心资产。因为这是他们变现的基础。只有拥有足够多的简历,让企业可以在该网站上获取需要的人才,才能持续从企业客户获得订单。以猎聘网为例。猎聘网的市场定位为满足企业中高端人才的需求。这使得猎聘向企业客户提供的简历是具有一定质量的中高层企业管理者、专业技术人才等。出售这样的简历资源,也是猎聘变现的主要来源。那么在

2016-09-28 00:22:09 2254 1

原创 使用R并行方式对数值型数据离散化

使用R并行方式对数值型数据离散化        数据的特征按照其取值可以分为连续型和离散型。离散数值属性在数据挖掘的过程中具有重要的作用。比如在信用卡评分模型中,当自变量很多时,并非所有字段对于目标字段来说都是有效的,因此通常的做法是通过计算woe值和iv值(类似于信息增益)来初步挑选通过对目标变量重要的字段,然后建模逻辑回归模型。而这当中就需要对数值型数据离散化。        数值型数

2016-08-21 22:51:57 8040 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除