自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 mapreduce 二次排序后reduce输出中key的变化

最近用java mr写了个二次排序,但是根据看到的博文写的是迭代器的key使用属于同一个组的所有key的第一个key,写了代码跑出数据后发现并不是,在网上找了半天,看到一篇关于mr values迭代器的源码文章,跟很久之前看到的类似,确认了自己的想法,reduce函数中遍历values迭代器的时候触发了key的重新赋值,根据reduce函数的参数,通常我们容易认为一个reduce的输入是{key,

2017-04-25 18:02:58 689

原创 mr counter

最近发现写mr的时候,counter打的完整,整个代码都美了,逻辑性强了,训练良好习惯。

2017-04-13 08:11:41 331

原创 特征选择和特征抽取

特征选择和特征抽取:首先特征选择和特征抽取没有先后关系,可以两个一起进行,也可以只用一个,都是降维的方法。特征抽取主要两种方法是PCA和LDA,其中LDA-主题生成,这两个使用的场景不一样,LDA可以用来分类,比如文档属于哪种主题,或者用什么关键词来代表。

2017-03-30 19:05:16 523

原创 奥卡姆剃刀原理

如无必要,勿增实体

2017-03-23 16:17:51 434

原创 生活感悟记

最近工作遇到很多mr优化的问题,各种join,都各有优缺点,我一定要把mr的join写一篇出来,边写边学习。

2017-03-21 22:45:58 211

图像的平均亮度

基于HSV空间,逐个像素点处理图像,求图像的平均亮度。

2013-11-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除