- 博客(4)
- 资源 (5)
- 收藏
- 关注
原创 Hbase Java API简单实践(附源代码解释)
详细代码及链接注释标注1标注2标注3标注4运行截图报错及解决过程参考资源详细代码及链接 maven依赖:hbase-client,slf4j-api,slf4j-nop(不需要hbase-server包) resource中加入hdfs-site.xml配置文件(不需要什么core-site.xml和hdfs-site.xml) resource中放置log4j.p
2017-10-29 11:31:46 1237
原创 Hive实战:将xml文件处理为txt文件,并用Hive进行微博数据分析
一 -xml文件处理文件简述xml处理代码遇见的问题及解决过程i -nbsp之类的字符无法解析ii -0xc0x11之类的字符无法解析iii -javalangOutOfMemoryError Java heap space二 -写到txtfile工具代码io版三 -Nio版的代码四 -两种版本的效率对比五 -建表加载数据加载数据报错要加载的数据格式与目标表的格式不同查询
2017-10-21 14:17:08 2518
原创 HIVE自定义UDF进行数据清理——IDEA
IDEA自定义UDF并使用- 创建maven项目- pomxml文件- java代码- 导出为jar- 导出带依赖的jar包- 在Hive命令行中执行- 参考IDEA自定义UDF并使用GitHub源码地址- 创建maven项目创建一个maven项目,添加hadoop-client和hive-exec的maven依赖相关依赖查询:http://mvnrepository.com/-
2017-10-20 11:32:28 2721
原创 HIVE小检验:
一 知识储备1压缩格式2存储格式i常见存储格式ii实际使用时的设置二 综合案列(一) 知识储备 (测试版本为基于Ambari2.5.1的hive1.2.1000)1、压缩格式 执行命令:set io.compression.codecs;查看目前hive已加载的编解码器 GzipCodec:压缩后的文件不支持split,压缩后为.gz文件 DefaultCodec:压
2017-10-17 14:27:15 506
Stream Processing with Apache Flink完整书签高清pdf和epub版,以及评价超高的Streaming Systems
2019-06-13
Flink Forward 201809 PPT berlin
2018-10-03
TensorFlow实战PDF+代码,TensorFlow实战Google深度学习框架+代码
2017-09-19
最新MySQL驱动(5.7可用)mysql-connector-java-5.1.40.zip
2017-02-12
李兴华oracle学习笔记(全)PDF
2017-02-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人