自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

知否

朝闻道,夕可眠矣

  • 博客(5)
  • 收藏
  • 关注

转载 R语言 简单做图 转载记录

以下函数只为满足常用的若干作图需求。基本作图:plot(x)、plot(x, y)    #散点图,最多两个变量    #可使用参数type生成不同的效果图。常用‘l’、‘o’、‘h’,分别为折线图,点线图,垂线图。    #'s'和'S'是折线图,前者是先水平后垂直,后者是先垂直后水平;'n'是不显示,用于画空白图    #若需对三个以上变量两两作图,可先合并在一个数据框

2015-07-16 17:48:17 1820

转载 逻辑回归模型(Logistic Regression, LR)基础

http://www.cnblogs.com/sparkwen/p/3441197.html?utm_source=tuicool逻辑回归模型逻辑回归(Logistic Regression, LR)模型其实仅在线性回归的基础上,套用了一个逻辑函数,但也就由于这个逻辑函数,使得逻辑回归模型成为了机器学习领域一颗耀眼的明星,更是计算广告学的核心。本文主要详述逻辑回归模型的

2015-07-14 15:10:54 701

原创 记录

从看hadoop mr 到odps mr 到odps sql 顺便也以一推三推到了hive去年开始 一晃也过了快一年了写了自己第一个全套的job 数数job数大概30个多一点 也算是个小的反馈数据了 挺好 记录一下。想画个图 不过先这样。代码毕竟也算公司资产- -。

2015-07-14 15:07:31 306

转载 hive 随机数避免数据倾斜

转载 仅作记录发生数据倾斜时,通常的现象是:任务进度长时间维持在99%(或100%),查看任务监控页面,发现只有少量(1个或几个)reduce子任务未完成。查看未完成的子任务,可以看到本地读写数据量积累非常大,通常超过10GB可以认定为发生数据倾斜。数据倾斜一般是由于代码中的join或group by或distinct的key分布不均导致的,大量

2015-07-14 15:00:11 5261

转载 grep:Binary file (standard input) matches

grep "key" xxx.log时输出Binary file xxx.log matches百度了一下:grep认为这是二进制文件,解决方案:grep -a。grep -a "key" xxx.log

2015-07-07 13:55:20 393

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除