- 博客(2)
- 收藏
- 关注
原创 第四模块:Hive
Hive Hadoop在分布式数据处理中遇到的问题 MR开发调试复杂,不适合要求快速得出结果的场景。 Hadoop由Java开发,对JAVA支持最好,对其他语言的使用者不够友好。 需要对Hadoop底层具有一定的了解,并且熟悉API才能开发出优秀的MR程序。 概述 Hive是一个建立在Hadoop基础之上的数据仓库工具,以HiveQL(类SQL)的操作方式让我们能够轻松的实现分布式的海量离线数据处理。而不必去编写调试繁琐的MR程序。 优点: 避免了MR繁琐的开发调试过程,Hive自动将我们输入的HQL编译为
2021-08-24 17:03:02 199
原创 大数据简介
1 大数据 1.1 什么是大数据 大数据就是海量数据的处理。 1.2 为什么要学习大数据 1.3 课程设计 1.4 大数据相关技术 1.4.1 海量数据获取 1.4.2 海量数据存储 1.4.3 海量数据处理 2 网站日志分析系统 2.1 数据收集:JS埋点 2.1.1 前端页面如何将数据发送到后端系统? 2.1.2 在哪里发起Get请求? 2.2 系统架构设计 2.3 八个重要指标 2.4 项目搭建 2.4.1 JS 2.4.2 Log4j 2.4.3 Servlet 2.5
2021-08-12 17:26:58 206
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人