自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

youchuikai的博客

不积跬步 无以至千里; 不积小流 无以成江海

  • 博客(13)
  • 收藏
  • 关注

原创 Cloudera Hive传统权限管理设置

Cloudera Hive 传统权限管理设置

2017-06-09 14:04:52 991

翻译 Hive权限管理默认认证-传统模式

Hive权限管理默认认证-传统模式本文档通过基本认证模式来描述Hive安全,在hive客户端层面控制进入hive元数据。 免责声明: hive authorization 不是完全安全,这个基本的认证模式打算主要是为了良好的用户去预防偶然的误操作,但是不能保证恶意的用户做恶意的事情,详情可以查看 Hive authorization main page中涉及安全的选项。前提要求: 为了使用hi

2017-05-17 18:01:17 2836 1

原创 全概率和贝叶斯公式

全概率和贝叶斯公式 引言:到什么山头唱什么歌! 0. 条件概率P(A | B) = P(AB) / P(B),变形P(AB)=P(A)*P(B|A) 1. 若某个事件B的发生是由于多个原因(Ai)引起,且这些原因构成一个完备的事件组,则常将事件B分解为一些简单的A1,A2 … 等事件,从而可以通过全概率公式来出概率P(B)。

2017-04-14 14:20:54 1518

转载 gitlab备份与恢复

## Backup restore gitlab backup restore document

2017-04-14 08:34:20 3424

翻译 Hive Query Sample 查询样本抽样

hive抽样查询 分桶表抽样数据块抽样

2017-04-13 11:48:19 2943

原创 Lamda架构-分析日志流水线

Lamda架构 前言:日志分析中既有离线大规模需求,也有实时性需求,因此需要采用Lamda架构(目的是为大数据分析应用程序提供一个低响应延迟的组合数据环境)构建日志分析流水线。

2017-03-28 09:28:50 1227

原创 spark在windows本地调试

spark程序在windows下本地调试前言: 在最初接触spark分布式平台程序开发时,如何快速的调试spark应用程序,提高开发效率尤为重要。正所谓兵马未动,粮草先行。因此接下来开始准备高效的spark开发环境。

2017-03-27 22:35:56 3744

原创 spark-submit ClassNotFoundException的问题解决

I wrote a spark program with scala,but when I use “spark-submit” to submit my project, I met the java.lang.ClassNotFoundException. 注意提交的spark-submit的 –class参数必须要完整的代码package包名.scala文件名组合。

2017-03-26 10:27:54 11228 2

原创 互联网日志分析技术及分析指标

日志分析必要性 日志格式 传统单机日志数据分析 大规模分布式日志分析日志分析指标网站运营日志分析常用指标 PV Page View UV Unique Visitor PVUV Page View Per User 漏斗模型与转化率 留存率 用户属性终极目标使用界面展示

2017-03-23 23:49:39 4642 1

原创 proxifier安装激活使用

proxifier安装激活使用

2017-03-23 22:44:17 13927 5

原创 sublime工具Package Control安装使用

Sublime工具下载以及package control安装使用

2017-03-23 22:36:51 964

原创 Intellij IDEA 2016.2.5软件安装激活

Intellij IDEA 201625软件安装激活IDEA版本下载地址安装激活Intellij IDEA 2016.2.5软件安装激活 背景:由于git config配置混乱,最后导致在IDEA上无法commit push 代码至GitHub。所以重新安装最新版IDEA。IDEA版本IntelliJ IDEA 2016.2.5下载地址链接: http://pan.baidu.com/s

2017-03-22 13:20:37 1609

原创 Hive Beeline HiveServer2使用

如何使用Hive Beeline?1. 后台启动HiveServer2 (默认的端口为10000,可以通过配置更改端口号)2. 启动$HIVE_HOME/bin/beeline脚本3. !connect jdbc:hive2://localhost:10000 username passwd

2017-03-21 22:02:51 3694

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除