在一个数据分析系统中,后端要做的任务

本文介绍了如何在虚拟机上进行Hive数据仓库的建表和数据导入,通过IDEA连接Hive,并使用Spark进行数据处理。同时,提到了使用Spark支持Hive的方法,以及借助DataX将Hive数据传输到MySQL的过程。
摘要由CSDN通过智能技术生成

1、先把文件上传至虚拟机
2、hive数仓建表,从本地导入数据

创建数据库

create table if not exists data_name(name string,age int)  
row format delimited fields terminated by ','  
lines terminated by '\n';

从本地导入数据

load data local inpath '/usr/local/software/data_name.txt' into table data_name

3、IDEA链接hive数仓

将hive/conf/hive-site.xml 拷贝到spark的conf目录下。
将Hive元数据库MySQL的驱动jar包拷贝到spark的jars目录下。
如果访问不到HDFS,将hdfs-site.xml,以及core-site.xml拷贝到spark的conf目录下。
启动spark-sql,然后执行select * from tablename。

1)导入依赖。

<dependency>
    <groupId>org.apache.spark</groupId>
    <artifactId>spark-hive_2.12</artifactId>
    <version>3.0.0</version>
</dependency>

<dependency>
    <groupId>org.apache.hive</groupId>
    <artifactId>hive-exec</artifactId>
    <version>2.3.3</version>
</dependency>

2)将hive-site.xml 文件拷贝到项目的 resources 目录中。

3)使用spark操作hive数据库的代码实现。

val sparkConf = new SparkConf()
.setMaster("local[*]") // 模式为本地模式,自动分配线程数量
.setAppName("hive") // 该spark应用命名为hive

val spark:SparkSession = SparkSession.builder()
  .enableHiveSupport()
  .config(sparkConf)
  .getOrCreate()

spark.sql("show databases").show()
spark.sql("create database spark_sql")
spark.sql("show databases").show()

4、spark处理数据
清洗数据+筛选数据+数据计算

5、用DataX将hive传输数据到mysql
参考:利用DataX实现hive到MySQL
 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
在多人协作开发后台管理系统后端时,可以考虑以下分工思路: 1. 项目经理:负责整体项目的规划、协调和管理,与客户进行沟通,分配任务和监督进度。 2. 后端架构师:负责设计系统的整体架构,搭建项目框架,定义数据库结构和接口规范。 3. 后端开发人员:根据项目经理和架构师的要求,负责具体功能模块的开发和编码工作,包括用户认证、数据查询、增删改操作等。 4. 数据库管理员:负责数据库的设计、创建和维护,确保数据的安全性和完整性,处理数据库相关的性能优化和故障排查。 5. 测试工程师:负责系统的测试工作,包括编写测试用例、执行测试、发现并修复漏洞和问题。 6. 安全工程师:负责系统的安全性评估和加固工作,包括用户身份验证、数据加密、输入验证等方面的安全防护措施。 7. 运维工程师:负责项目的部署和服务器的配置,监控系统的运行状态,处理系统故障和优化性能。 8. 文档编写人员:负责编写项目文档,包括需求分析、设计文档、接口文档、使用手册等,方便团队成员之间的沟通和知识共享。 以上是一种常见的分工思路,具体分工可以根据团队成员的技能和经验进行调整。同时,团队成员之间需要保持良好的沟通和协作,定期进行进度汇报和问题讨论,确保项目的顺利进行。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值