大数据
王富贵儿。
纵使疾风起,人生不言弃。
展开
-
Hive 日期函数
https://blog.csdn.net/qq646748739/article/details/77997276https://www.cnblogs.com/moodlxs/p/3370521.htmlhttps://blog.csdn.net/duan19056/article/details/17758819https://blog.csdn.net/yidu_fanchen...原创 2018-10-12 16:36:30 · 194 阅读 · 0 评论 -
Hadoop简介
Hadoop是一种分布式数据和计算的框架。它很擅长存储大量的半结构化的数据集。数据可以随机存放,所以一个磁盘的失败并不会带来数据丢失。Hadoop也非常擅长分布式计算——快速地跨多台机器处理大型数据集合。MapReduce是处理大量半结构化数据集合的编程模型。编程模型是一种处理并结构化特定问题的方式。例如,在一个关系数据库中,使用一种集合语言执行查询,如SQL。告诉语言想要的结果,并将它提交给系统...转载 2018-07-10 16:14:24 · 307 阅读 · 0 评论 -
Hive
Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分析。是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计...转载 2018-07-10 16:17:48 · 201 阅读 · 0 评论