本文是企业实际上线干货,解决很多问题,拒绝空洞废话。本场 Chat 将带您认识 Spark+Hbase 解决企业 3 亿+大数据的分析、计算、入库,让你少走弯路,不入坑。
本文适合初学 Spark、Hbase 和具有一定经验的 Spark 实践者学习。作为实践派,您将在本文学习到如下知识:
- Spark 的集群配置、搭建
- Spark 的定时任务的编写
- Spark 的异常监控
- Spark 的程序打包和任务提交
- Hbase 数据库的 Rowkey 设计、散列、预分区
- 批量写入 Hbase 数据
- Hbase DAO 的编写
- scala和java,springboot混合编程
- Q&A
本文中含大量实际上线代码,让你拿来就能用,不用重新自己踩坑。
篇幅所限,在第二篇 Chat 中我们将介绍 Spark 的计算程序编写和 100 倍的性能优化。
阅读全文: http://gitbook.cn/gitchat/activity/5d41313bf537024c49e90483
您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。