hivecontext mysql_Spark 从零到开发（六）HiveContext

最新推荐文章于 2021-02-15 23:00:28 发布

感谢型歌姬亚瑟

最新推荐文章于 2021-02-15 23:00:28 发布

阅读量183

点赞数

文章标签： hivecontext mysql

本文链接：https://blog.csdn.net/weixin_42306002/article/details/113279928

版权

本文介绍了如何使用Spark SQL的HiveContext进行数据处理，从Java本地执行到集群脚本运行。展示了从json文件读取数据，创建DataFrame，进行数据展示、元数据查看、列选择、计算等操作，并详细说明了集群执行的步骤，包括编写执行脚本、上传数据到HDFS及执行脚本的过程。

摘要由CSDN通过智能技术生成

Spark SQL执行引擎的一个实例，它与存储在Hive中的数据集成在一起。从类路径上的hive-site.xml读取Hive的配置。

1. java本地执行

1.1 json文件：{"id":1,"name":"FantJ","age":18}

{"id":2,"name":"FantJ2","age":18}

{"id":3,"name":"FantJ3","age":18}

{"id":4,"name":"FantJ4","age":18}

{"id":5,"name":"FantJ5","age":18}

{"id":6,"name":"FantJ6","age":18}

1.2 DataFormCreate.javapublic class DataFormCreate {

public static void main(String[] args) {

SparkConf conf = new SparkConf().setAppName("DataFormCreate").setMaster("local");

JavaSparkContext sc = new JavaSparkContext(conf);

SQLContext sqlContext = new SQLContext(sc);

DataFrame df = sqlContext.read

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

感谢型歌姬亚瑟

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

spark sql操作mysql_spark sql——5. spark sql操作mysql表

weixin_35231383的博客

02-07

342

目标：1.jdbc到mysql，读mysql的表并load成dataframe2.对dataframe执行dsl、sql语句3.两张表的连接查询操作4.另存dataframe为表，保存到mysqlspark自带的案例在：/examples/src/.../sql/SQLDataSourceExample.scalajar包：jdbc的jar包为mysql-connector-java-5.1.47...

hive Context

bupt041137的专栏

08-26

147

Driver： public int compile(String command) { ctx = new Context(conf); // } public Context(Configuration conf) throws IOException { this(conf, generateExecutio...

参与评论您还未登录，请先登录后发表或查看评论

hiveContext演示

岸芷汀兰

01-04

1万+

使用 hiveContext 之前首先要确认以下两点:1 使用的 Spark 是支持 hive 2 Hive 的配置文件 hive-site.xml 已经存在 conf 目录中前者可以查看 lib 目录下是否存在以 datanucleus 开头的 3 个 JAR 来确定,后者注意是否在 hive-site.xml 里配置了 uris 来访问 Hive Metastore。1. 启动 hive

Spark SQL 1.x之Hive Context

vincent_duan的专栏

03-26

334

使用SparkSQL时，并不需要搭建一个Hive，只需要一个HiveSite就可以添加Hive配置文件将Hive中的hive-site.xml复制到spark中的conf文件夹下。添加依赖在pom.xml文件中添加HiveContext的依赖： <dependency> <groupId>org.apache.spark</groupId&...

SparkSQL 初步应用（HiveContext使用）

weixin_34194087的博客

04-17

216

折腾了一天，终于解决了上节中result3的错误。至于为什么会产生这个错误，这里，先卖个关子，先看看这个问题是如何发现的：首先，找到了这篇文章：http://apache-spark-user-list.1001560.n3.nabble.com/SparkSQL-select-syntax-td16299.html 里面有这么一段：The issue is that yo...

【五】Spark SQL中HiveContext的使用（操作hive中的表）（提交到服务器上执行）（Hadoop HA）

热门推荐

Sid小杰的博客

07-25

1万+

HiveContext在基本的SQLContext上有了一些新的特性，可以用Hive QL写查询，可以读取Hive表中的数据，支持Hive的UDF。要把hive/conf/hive-site.xml文件拷贝到spark/conf下。 cd /app/hive/conf scp hive-site.xml root@node1:/app/spark/spark-2.2.0-bin-2.9.0...

spark连接mysql创建hive表_Spark SQL操作Hive数据库

weixin_30010773的博客

02-11

725

http://kevin12.iteye.com/blog/2273532Spark集群搭建：http://kevin12.iteye.com/blog/2273532数据准备在/usr/local/sparkApps/SparkSQL2Hive/resources/目录下创建people.txt内容如下，name和age之间是"\t"分割Michael 20Andy 17Justin...

spark 写mysql 设置主键_Spark:将DataFrame写入Mysql

weixin_34959044的博客

12-30

481

Spark将DataFrame进行一些列处理后，需要将之写入mysql，下面是实现过程1.mysql的信息mysql的信息我保存在了外部的配置文件，这样方便后续的配置添加。1 //配置文件示例：2 [hdfs@iptve2e03 tmp_lillcol]$ cat job.properties3 #mysql数据库配置4 mysql.driver=com.mysql.jdbc.Driver5 my...

spark删除mysql记录_SparkSQL DataFrame与MySQL增删改查那些事儿

weixin_35827472的博客

01-18

943

在使用Spark中通过各种算子计算完后各种指标后，一般都需要将计算好的结果数据存放到关系型数据库，比如MySQL和PostgreSQL等，随后配置到展示平台进行展现，花花绿绿的图表就生成了。下面我讲解一下，在Spark中如何通过c3p0连接池的方式对MySQL进行增加改查(CRUD)，增加(Create)，读取查询(Retrieve)，更新(Update)和删除(Delete)。项目github地...

spark sql: HiveContext操作hive表

eyeofeagle的博客

08-22

1856

使用cdh搭建hadoop集群, 下载hive客户端配置文件 1,配置pom.xml <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.10</artifactId> <version>1.5.0-c...

hivecontext mysql_Spark on Yarn with Hive实战案例与常见问题解决

weixin_35843569的博客

02-15

257

[TOC]1 场景在实际过程中，遇到这样的场景：日志数据打到HDFS中，运维人员将HDFS的数据做ETL之后加载到hive中，之后需要使用Spark来对日志做分析处理，Spark的部署方式是Spark on Yarn的方式。从场景来看，需要在我们的Spark程序中通过HiveContext来加载hive中的数据。如果希望自己做测试，环境的配置可以参考我之前的文章，主要有下面的需要配置：1.Hado...

spark集成hivecontext配置

weixin_30709809的博客

06-29

226

spark版本：spark-1.6.0-bin-hadoop2.6hive版本：hive 1.2.11.hive-site.xml<property> <name>hive.metastore.uris</name> <value>thrift://master:9083</value></property>2.配置将ha...

Spark SQL | HiveContext 用法

weixin_37417954的博客

07-03

626

代码如下： object demo2 { def main(args: Array[String]): Unit = { val sparkConf = new SparkConf() //sparkConf.setAppName("HiveContext").setMaster("local[*]") val sc = new SparkContext(sp...

SqlContext和HiveContext

杜海的博客

11-15

1483

SqlContext: 应该是对应spark-sql这个project; 与hive解耦，不支持hql查询;HiveContext:应该是对应spark-hive这个项目; 与hive有部分耦合, 支持hql,是SqlContext的子类,也就是说兼容SqlContext; SQLContext 是什么? SQLContext是通往SparkSQL的入口。下面是如何使用SparkContext...

HIVE-API

会飞的猪的博客

11-09

383

用Maven进行项目管理 package com.ny.hive.hivedemo;import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet; import org.junit.Before; import org...

hive Context类和DriverContext类

weixin_33969116的博客

12-18

141

在hive的源码中经常可以看到Context类和DriverContext类，咋一看感觉这两个意思差不多，其实其作用区别还是蛮大的：org.apache.hadoop.hive.ql.Context类存储job的上下文信息，一个job创建一个Context对象，job运行完后，调用clear方法进行清除1）初始化/创建/删除中间目录中间的目录包括local job的和非loc...

Spark 从零到开发（六）HiveContext

weixin_34248118的博客

08-18

131

Spark SQL执行引擎的一个实例，它与存储在Hive中的数据集成在一起。从类路径上的hive-site.xml读取Hive的配置。 1. java本地执行 1.1 json文件： {"id":1,"name":"FantJ","age":18} {"id":2,"name":"FantJ2","age":18} {"id":

HiveContext和SQLContext

leehbing的博客

02-25

7103

使用SparkSQL时注意HiveContext和SQLContext的关系：见源码： class HiveContext(sc : org.apache.spark.SparkContext) extends org.apache.spark.sql.SQLContext with org.apache.spark.Logging { SqlContext: 应该是对应spark

掌握PHP MYSQL扩展开发：从零入门到实战

- 配置编译环境：添加MYSQL_ROOT\include到预处理器包含目录，解决头文件查找问题；将MYSQL_ROOT\lib\opt添加到链接器的附加库目录，确保链接正确的库文件，包括php5nts.lib。 4. **注意事项**: - 确保编译设置...