- 博客(5)
- 资源 (4)
- 收藏
- 关注
原创 hive 理解
1、什么是Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL)。2、Hive诞生的意义降低学习难度,学习成本,让大部分程序员都能够使用HADOOP集群。3、Hive特点可扩展,Hive依赖HADOOP,存储使用HDFS,计算使用MapReduce,Hive的扩展能力实际就是HDFS,MapReduce的扩展能力。延展性,Hive支持自定义函数,用于实现已经提供的函数无法计算的业务。容错,节点出现问题SQL仍可完成执行,本质
2020-11-30 21:01:36 634
原创 ider 连接 hive
前提 开启hadoop启动之后查看 jpsnamenodeDataNodeSecondaryNamenodeNodeManagerResourceManageJps有这些就是正常的namenodeDataNodeNodeManagerResourceManageJps启动 beeline1、hive --service hiveserver2 &2、beeline3、!connect jdbc:hive2://node01:100004、用户名5、密码如
2020-11-29 17:26:40 146
原创 hive 的简介
一、Hive基本概念1.1、Hive简介什么是HiveHive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL)。其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,hive可以理解为一个将SQL转换为MapReduce的任务的工具。为什么使用Hive1、直接使用hadoop所面临的问题人员学习成本太高项目周期要求太短MapReduce实现复杂查询逻辑开发难度太大2、为什么要使用Hive操
2020-11-19 20:20:28 222
原创 mysql
1.华北大区的 微信交易的总比数SELECT COUNT(*)FROM itcast_paymentsJOIN itcast_orders ON itcast_orders.payType=itcast_payments.idJOIN itcast_order_goods ON itcast_orders.orderId=itcast_order_goods.orderIdJOIN itcast_goods ON itcast_order_goods.go
2020-11-12 17:22:47 123
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人