- 博客(4)
- 资源 (15)
- 收藏
- 关注
原创 Neither the HADOOP_CONF_DIR nor the YARN_CONF_DIR environment variable is set. The Flink YARN Client
Neither the HADOOP_CONF_DIR nor the YARN_CONF_DIR environment variable is set. The Flink YARN Client needs one of these to be set to properly load the Hadoop configuration for accessing YARN.Ple
2017-05-25 09:53:09 7044 1
原创 Hbase WAL 机制记录
Write-Ahead-Log(WAL)该机制用于数据的容错和恢复:每个HRegionServer中都有一个HLog对象,HLog是一个实现Write Ahead Log的类,在每次用户操作写入MemStore的同时,也会写一份数据到HLog文件中(HLog文件格式见后续),HLog文件定期会滚动出新的,并删除旧的文件(已持久化到StoreFile中的数据)。当HRegionS
2017-05-22 15:44:44 897
原创 Spark VS Flink
转自 :http://data-flair.training/blogs/comparison-apache-flink-vs-apache-spark/ Spark is considered as 3G of Big Data, whereas Flink is as 4G of Big Data (在流处理方面我同意这个结论).1. Objective
2017-05-15 15:20:38 750
原创 HadoopMR vs Spark vs Flink 特性对比
看了下flink,然后找到了一篇对比文章,但是这篇文章的作者是偏向于flink的,有些对比,我们就看看,不说话。个人认为spark是批处理的老大,flink是流式处理的老大。至于表处理,spark也是不落下,列式存储parquet以及列式数据集dataFrame,以及执行计划的自动优化使得数据的处理性能,和hive2 Tenz / impala有点一拼,但是掌握spark技术栈,可以应付绝
2017-05-15 14:56:02 2339
useragent解析逻辑&手机品牌匹配.txt
2021-11-22
shakespeare.json&logs;.jsonl.gz&accounts;.zip
2018-01-10
kafka-manager 1.3.3.15
2018-01-08
百度网盘 数据仓库工具箱 维度建模权威指南 第3版 全
2017-10-16
数据仓库工具箱 维度建模权威指南 第3版
2017-10-16
IDEA 创建scala工程并打指定的依赖包
2017-08-11
hbase自定义Comparator进行数值比较
2016-11-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人