Hadoop的Hive数仓与ElasticSerach进行集成

Hadoop集群的版本      :2.7.1                                                                          ElasticSerach集群版本:6.0.1

启动Hive,启动ElasticSerach,去ElasticSerach官网下载:https://www.elastic.co/cn/downloads/past-releases

将下载的zip文件解压缩,拷贝出

elasticsearch-hadoop-6.0.1.jar

拷贝进Hive/lib目录下面

运行hive 的客户端

将es-hadoop的驱动包添加进当前会话中

add jar /usr/hdp/2.4.3.0-227/elasticsearch-hadoop.jar;

创建索引Mapping

PUT http://192.168.1.201:9200/rbc_users

{
	"settings": {
		"number_of_shards": 3,
		"number_of_replicas": 1
	},
	"mappings": {
		"doc": {
			"dynamic": "true",
			"properties": {
				"uid": {
					"type": "text"
				},
				"name": {
					"type": "text",
					"index": "true",
					"analyzer": "ik_max_word",
					"search_analyzer": "ik_max_word",
					"fields": {
						"raw": {
							"type": "keyword",
							"ignore_above": 256
						}
					}
				}
			}
		}
	}
}

创建 外表

CREATE EXTERNAL TABLE test(
id string,
uid string,
name string)
STORED BY 'org.elasticsearch.hadoop.hive.EsStorageHandler'
TBLPROPERTIES(
'es.resource' = 'rbc_users/doc',
'es.index.auto.create'='false',
'es.mapping.id' = 'id',
'es.nodes' ='192.168.1.201:9200,192.168.1.202:9200,192.168.1.203:9200,192.168.1.204:9200');

 

Hadoop Hive数仓实战项目是基于HadoopHive技术的数据仓库项目。在这个项目中,使用Hadoop集群来存储和处理大规模的数据,并使用Hive作为数据仓库的查询和分析工具。 在项目中,首先需要添加一个hadoop用户组,并创建一个hadoop用户,并设置用户密码。然后,切换到hadoop用户,并启动Hive。通过Hive,可以执行一系列的命令,如展示数据库、退出等操作。 引用中提到,Hive建立在Hadoop之上,具有与Hadoop相同的可扩展性,可以轻松应对大规模的数据处理需求。这意味着Hadoop Hive数仓实战项目可以处理大规模的数据,并能够支持超过1000个节点的Hadoop集群。 另外,引用中提到了一些配置文件的重要性,如hive-site.xml和hive-default.xml,它们可以通过设置-hiveconf参数来进行配置。 综上所述,Hadoop Hive数仓实战项目是一个基于HadoopHive技术的大规模数据仓库项目,可以通过Hive进行数据查询和分析,并具有与Hadoop相同的可扩展性。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [大数据开发基础入门与项目实战(三)Hadoop核心及生态圈技术栈之3.数据仓库工具Hive基础](https://blog.csdn.net/CUFEECR/article/details/121189073)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值