- 博客(5)
- 资源 (4)
- 收藏
- 关注
原创 Apache Hive进阶实战
Udf 单行函数:一行输入一行输出Udaf 多行函数:多行输入一行输出Udtf 用户表函数:一行输入多行输出,主要用在侧视图Hive视图概述:视图是一个元数据,只能在MySQL DataStore中找到视图是一种逻辑结构,通过在虚拟表中隐藏子查询、连接和函数来简化查询,数据查询的快捷方式,把复杂的查询放在view里Hive视图不存储数据或获得物化一旦创建...
2019-04-11 00:09:11 721
原创 Apache Hive基础实战
什么是Hive:建立在Hadoop之上的数据仓库解决方案提供类似sql的查询语言,命名为Hive查询语言HQL,它有最小的学习曲线早期的Hive开发工作于2007年在Facebook开始Hive让更多的人使用Hadoop今天Hive是Hadoop下的顶级Apache项目,网址是hive.apache.orgHive可以看成是基于Hadoop的mysqlHive把Hado...
2019-04-10 23:42:47 1808
原创 MapReduce基础原理及应用
MapReduce基础原理:MapReduce(起源于Google):MapReduce是一种计算模型,它将大型数据操作作业分解为可以跨服务器集群并行执行的单个任务。用于管理DataNode用于大规模数据处理:每个节点处理存储在该节点上的数据每个MapReduce工作由两个阶段组成:Map;Reduce自动MapReduce计算:MapReduce计算是并行和自动分布的...
2019-04-07 20:20:44 6071
原创 大数据Hadoop核心概念
大数据是一个术语用来描述一个拥有高速,复杂,和复杂数据;但是需要先进的技术和技能能够获得,存储,描述,管理和分析信息QPS:query per second每秒响应大数据四大特点:容量大(Volume);速度快(Velocity);数据多样性(Variety);价值密度比较低(Value)数据多种格式(Variety):结构化数据:SQL,主要是关系型数据库,表格形式的数据,C...
2019-04-02 17:04:30 1769
原创 Linux基础语法,Shell基础脚本
Linux基础语法:1. / :绝对路径:/home/anaconda3 相对路径:anaconda3 用户home: ~2. pwd :输出当前工作目录的全名3. ls :列出目录内容ls -l :长清单格式ls -a :所有条目ls -d :列表目录ls -R :列出子目录ls -1 :一行显示一个名字ls -F :有分类的目...
2019-04-01 20:28:49 692
dbeaver.rar
2020-07-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人