自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (5)
  • 收藏
  • 关注

原创 Hive分区查询

显示表分区:hive> show partitions table_name;根据表分区查询数据:hive> select * from table_name where partition_date='2018-04-10' ; 

2018-04-13 16:12:32 62954

原创 集群运行SparkR代码

编写R语言的代码(sparktest.R )library(SparkR)# Initialize SparkSessionsparkR.session(appName = "SparkR-DataFrame-example")# Create a simple local data.framelocalDF <- data.frame(name=c("John", "Smith...

2018-04-10 18:05:58 537

原创 集群运行PySpark代码

编写python代码(wordcount.py)import sysfrom operator import addfrom pyspark.sql import SparkSessionif __name__ == "__main__": spark = SparkSession.builder.appName("PythonWordCount").getOrCreate()...

2018-04-10 17:25:52 3162

原创 Hive统计函数

(1)count(*) 作用:统计检索出的行的个数,包括NULL值的行    count(t) 作用:返回指定字段的非空值的个数    count(distinct t) 作用:返回指定字段的不同的非空值的个数(2)sum(t) 作用:统计结果集中col的相加的结果    sum(distinct t) 作用:统计结果中col不同值相加的结果(3)avg(t) 作用:统计结果集中col的平均值  ...

2018-04-02 13:30:33 5571

原创 Hive数值计算函数

(1)round(45.666,2) 作用:四舍五入,保留2位小数    ceil(45.6) 作用:向上取整    floor(45.6) 作用:向下取整(2)rand() 返回一个0到1范围内的随机数(3)exp(double a) 返回自然对数e的a次方   ln(double a)返回a的自然对数(4)log10(double a) 返回以10为底的a的对数   log2(double a...

2018-04-02 12:48:49 5707

原创 Hive字符串函数

(1)length('abcedfg') 作用:返回字符串的长度  (2)reverse('abcedfg') 作用:返回字符串的反转结果(3)concat(‘abc’,'def’,'gh’) 作用:返回输入字符串连接后的结果,支持任意个输入字符串    concat_ws(‘,’,'abc’,'def’,'gh’) 作用:返回输入字符串连接后的结果,','分隔符(4)substr,substri...

2018-04-02 11:00:50 10818

原创 Hive日期函数

(1)unix_timestamp('2018-12-05 08:45:17') 作用:统计从1970年开始到现在的秒数(2)from_unixtime(1525509615,'yyyyMMdd') 作用:日期函数UNIX时间戳转日期函数(3)to_date('2018-12-08 10:08:01') 作用:返回日期时间字段中的日期部分(4)year,month,day('2018-12-08 ...

2018-04-02 10:27:43 542

原创 公众号收集

互联网资讯:stormzhang,虎嗅网,AI财经社,AI前线技术路线:人人都是产品经理,caoz的梦呓,待字闺中,Spenser,公关界的007理财:说钱,招财大牛猫,小白读财经学说苏州话:苏白学堂,吴语学堂,潮吴语,苏州闲话,说苏哉身体健康:世界颈椎健康联盟,学习:建昆老师,加宁老师,欧阳平老师,超级青少年,大胆设想...

2018-04-01 22:52:07 362

druid数据分析原理与实践

Druid实时大数据分析原理与实践.pdf 高清,欧阳辰,数据仓库架构必备。

2019-06-25

大数据及其常用组件介绍

本TTP为大数据及其常用组件的基本介绍(hdfs hive hbase kafka spark kudu impala kylin streamsets)仅供参考。

2018-11-06

Apache Kylin操作流程

Apache Kylin操作流程截图分享,及配套文字讲解,仅做参考。

2018-06-27

n2n windows端

该文件对应csdn博客(n2n内网穿透搭建)中n2n本地服务器的windows端应用程序使用,请配套使用。

2018-05-23

window平台 ncat工具

windows平台下ncat工具,Netcat用于从TCP/UDP连接中读取或发送网络数据。(使用方法:ncat.exe -l -k -p 6666)

2018-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除