- 博客(5)
- 收藏
- 关注
转载 R语言 简单做图 转载记录
以下函数只为满足常用的若干作图需求。基本作图:plot(x)、plot(x, y) #散点图,最多两个变量 #可使用参数type生成不同的效果图。常用‘l’、‘o’、‘h’,分别为折线图,点线图,垂线图。 #'s'和'S'是折线图,前者是先水平后垂直,后者是先垂直后水平;'n'是不显示,用于画空白图 #若需对三个以上变量两两作图,可先合并在一个数据框
2015-07-16 17:48:17 1820
转载 逻辑回归模型(Logistic Regression, LR)基础
http://www.cnblogs.com/sparkwen/p/3441197.html?utm_source=tuicool逻辑回归模型逻辑回归(Logistic Regression, LR)模型其实仅在线性回归的基础上,套用了一个逻辑函数,但也就由于这个逻辑函数,使得逻辑回归模型成为了机器学习领域一颗耀眼的明星,更是计算广告学的核心。本文主要详述逻辑回归模型的
2015-07-14 15:10:54 701
原创 记录
从看hadoop mr 到odps mr 到odps sql 顺便也以一推三推到了hive去年开始 一晃也过了快一年了写了自己第一个全套的job 数数job数大概30个多一点 也算是个小的反馈数据了 挺好 记录一下。想画个图 不过先这样。代码毕竟也算公司资产- -。
2015-07-14 15:07:31 306
转载 hive 随机数避免数据倾斜
转载 仅作记录发生数据倾斜时,通常的现象是:任务进度长时间维持在99%(或100%),查看任务监控页面,发现只有少量(1个或几个)reduce子任务未完成。查看未完成的子任务,可以看到本地读写数据量积累非常大,通常超过10GB可以认定为发生数据倾斜。数据倾斜一般是由于代码中的join或group by或distinct的key分布不均导致的,大量
2015-07-14 15:00:11 5261
转载 grep:Binary file (standard input) matches
grep "key" xxx.log时输出Binary file xxx.log matches百度了一下:grep认为这是二进制文件,解决方案:grep -a。grep -a "key" xxx.log
2015-07-07 13:55:20 393
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人