Java + Spark SQL + Hive + Maven简单实现和异常问题

最新推荐文章于 2024-07-26 07:45:00 发布

IT狗探求

最新推荐文章于 2024-07-26 07:45:00 发布

阅读量1.1w

点赞数 1

分类专栏： Linux 大数据大数据专题文章标签： sparksql hive java maven hiveContext

本文链接：https://blog.csdn.net/a123demi/article/details/70766843

版权

一. 前期准备

1.linux搭建Java和Scala环境搭建

2. linux搭建hadoop+spark+hive分布式集群

hadoop分布式集群搭建：hadoop分布式集群搭建

spark分布式集群搭建:spark分布式集群搭建

hive分布式集群搭建：待完善

二.项目代码实现

1 需求

通过Spark Sql 查询Hive数据库数据

数据库：bi_ods;

表：owms_m_locator

2 maven 项目搭建

新增一个Mave project工程

maven project工程

3 实现代码

package com.lm.hive.SparkHive;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

IT狗探求

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

SparkSQL编程指南之Java篇一-入门

煉心的博客

02-16

1万+

1. Spark SQL的Java开发包 Spark SQL提供Java的开发包，当前最新版本是2.1.0版本：spark-sql_2.11-2.1.0.jar，可以从下面链接下载： http://central.maven.org/maven2/org/apache/spark/spark-sql_2.11/2.1.0/spark-sql_2.11-2.1.0.jar 或者通过

JAVASparkSQL

weixin_30636089的博客

12-25

146

1.SparkSQL基础 import java.util.ArrayList; import java.util.List; import java.util.Arrays; import java.util.Collections; import java.io.Serializable; import org.apache.spark.api.java.JavaRDD; ...

1 条评论您还未登录，请先登录后发表或查看评论

使用Java和Spark进行大数据分析

最新发布

省赚客开发者博客

07-26

555

在当今的大数据时代，快速和高效地处理和分析海量数据是许多企业的关键需求。本文将介绍如何使用Java和Spark进行大数据分析，涵盖Spark的基本概念、配置环境及典型的应用示例。本文详细介绍了如何使用Java和Spark进行大数据分析，包括数据读取、处理和结果输出的具体实现方法。通过使用Spark强大的分布式计算能力和Java的灵活性，可以高效地处理和分析海量数据，从而满足实际生产中的大数据分析需求。以下示例展示了如何使用Java和Spark进行基本的数据分析任务，包括数据读取、处理和结果输出。

RDD和DataFrame和DataSet三者间的区别

Alex的博客

01-07

486

https://blog.csdn.net/deng624796905/article/details/80216168 https://blog.csdn.net/weixin_43087634/article/details/84398036 这两篇文章讲的很详细，大神级别的，可以拜读 DataFrame多了数据的结构信息，即schema。RDD是分布式的Java对象的集合。DataFr...

【java-spark】sparksql入门小例子

weixin_37630333的博客

04-06

2043

TestData.json {"regNo": "1237855","sortTime": 1511402600000,"pname": "北京服装有限公司","brandRank": "服装-羽绒服"} {"regNo": "2236811","sortTime": 1461404600000,"pname": "上海市器械有限公司","brandRank": "运动球类球"} {"regNo": "3337815","sortTime": 1411401600000,"pname": "泉州奇鹭物联网科

Spark SQL【Java API】

功不唐捐，玉汝于成

05-24

1472

Spark SQL 【Java API】

HiveonSpark配置 Maven+spark编译+Hive配置

u014552259的博客

06-25

1945

一实验说明本实验主要完成Hvie on Spark的配置，主要内容包含maven配置、编译spark源码 spark配置 hive配置二配置步骤一、maven配置编译spark源码需要使用maven，我们先来配置一下maven环境。第一步：下载maven安装包编译spark建议使用maven3环境，下载连接为http://maven.apache.org/download.cgi，点击图中红框中的内容即可下载。第二步、安装下载完成后将maven安装包上传到Linux系统，我这里上传到了

java spark on hive_Spark On Hive 部署和配置

weixin_29056781的博客

02-24

635

Spark On Hive，通过spark sql模块访问和使用Hive，默认Spark预编译(pre-built)版不包含hive相关依赖，并不支持此功能，因此需要对spark源码进行重新编译，并进行相关的配置，下面是具体操作步骤：1.下载最新版spark源码包cd/data/soft/wget-chttp://apache.fayea.com/spark/spark-1.5.2/spar...

java读spark hive_项目实战从0到1之Spark（3）spark读取hive数据

weixin_29442031的博客

02-13

670

1.首先将集群的这3个文件hive-site.xml，core-size.xml,hdfs-site.xml放到资源文件里(必须，否则报错)2.代码方面。下面几个测试都可以运行。1)test03.javaimport org.apache.spark.sql.SparkSession;import java.text.ParseException;public classtest03 {publi...

Maven SSM+JAVA+Spark

疏影横斜水清浅

06-05

746

目录样例代码POM文件 Maven最关键的就是pom文件的配置，我们使用下面的版本： Spring 4.3.7.RELEASE Mybatis 3.2.8 Jackson 2.6.7 Hadoop 2.6.0 Scala 2.11.7 Spark 2.4.0 在该pom文件的配置过程中，我...

SparkSQL HDFS JAVA调用完整实例

06-28

SparkSQL HDFS JAVA调用完整实例，使用Maven管理，项目很小，里面实例很多。敬请下载。

spark连接HIveDemo

04-13

spark连接hive数据库的完整demo

SparkSQL的jdbc操作及java的api操作

03-19

关于SparkSQL的jdbc操作及java的api操作的Idea maven工程代码。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

sparksql java_JAVASparkSQL

weixin_39637979的博客

02-12

654

1.SparkSQL基础import java.util.ArrayList;import java.util.List;import java.util.Arrays;import java.util.Collections;import java.io.Serializable;import org.apache.spark.api.java.JavaRDD;import org.apache...

Java实现SparkSQL Thrift方式读取Hive数据

杨鑫newlife的专栏

01-17

712

前提是启动Thrit端口，我这里Thrift端口12000。 @Override public QueryResult SparkOnLine(String sql, String userName) { ResultSet resultSet = null; Statement stmt = null; Connection conn = null; boo

Spark SQL

小黄鸭的博客

09-03

829

教程： http://spark.apache.org/docs/latest/sql-programming-guide.html Spark SQL是用于结构化数据处理的Spark模块。与基本的Spark RDD API不同，Spark SQL提供的接口为Spark提供了有关数据结构和正在执行的计算的更多信息。Spark SQL的一个用途是执行SQL查询。Spark SQL还可用于从现有H...

DataFrame与DataSet的互操作

Faded1573606285的博客

11-10

514

1. DataFrame转换为DataSet 1）创建一个DateFrame scala> val df = spark.read.json("examples/src/main/resources/people.json") df: org.apache.spark.sql.DataFrame = [age: bigint, name: string] 2）创建一个样例类 sca...

spark sql java 实现_spark sql简单示例java

weixin_42459078的博客

02-16

312

运行环境集群环境：CDH5.3.0 具体JAR版本如下： spark版本：1.2.0-cdh5.3.0 hive版本：0.13.1-cdh5.3.0 hadoop版本：2.5.0-cdh5.3.0 spark sql的JAVA版简单示例 spark sql直接查询JSON格式的数据 spark sql的自定义函数 spark sql查询hive上面的表 i...

hiveonspark配置 maven+spark编译+hive配置

06-28

Hive on Spark是一种将Hive与Spark结合起来使用的方式，可以提高数据处理的效率和性能。下面是配置Hive on Spark的步骤： 1. 配置Maven 首先需要安装Maven，并配置好环境变量。可以在Maven官网下载最新版本的Maven...