SparkSQL
文章平均质量分 57
段渣渣
这个作者很懒,什么都没留下…
展开
-
Windows报Failed to locate the winutils binary in the hadoop binary path,java.io.IOException:
版权声明:未经允许,随意转载,请附上本文链接谢谢(づ ̄3 ̄)づ╭❤~ http://blog.csdn.net/xiaoduan_/article/details/79476815Windows平台上运行hadoop与spark程序涉及读写操作时报空指针等错误解决方案问题详细描述:Windows平台上运行hadoop与spark程序涉及读写操作时报 Failed to ...原创 2018-03-07 20:59:47 · 2396 阅读 · 0 评论 -
SparkSQL中SQL、DataFrame和DataSet方式的静态类型安全和运行时类型安全
版权声明:未经允许,随意转载,请附上本文链接谢谢(づ ̄3 ̄)づ╭❤~ https://blog.csdn.net/xiaoduan_/article/details/79751755SQL、DataFrame和DataSet方式的静态类型安全和运行时类型安全SQL: seleeeeeetc name from person; SQL关键字写错,编译 ok, 运行错误D...原创 2018-03-30 08:06:21 · 714 阅读 · 0 评论 -
thriftserver/beeline/jdbc等方式连接到SparkSQL
版权声明:未经允许,随意转载,请附上本文链接谢谢(づ ̄3 ̄)づ╭❤~ https://blog.csdn.net/xiaoduan_/article/details/79730384thriftserver/beeline、jdbc等方式连接到SparkSQLthriftserver和beeline的简单配置和使用启动thriftserver: 默认端口是10000 ,可以修...原创 2018-03-28 16:58:51 · 2304 阅读 · 0 评论 -
SparkSession的使用
版权声明:未经允许,随意转载,请附上本文链接谢谢(づ ̄3 ̄)づ╭❤~ https://blog.csdn.net/xiaoduan_/article/details/79730406SparkSession的使用SparkSession是spark2.x版本中推行的,作为统一的spark入口示例代码package com.anthony.sparkimport org...原创 2018-03-28 16:59:54 · 1362 阅读 · 0 评论 -
SQLContext与HiveContext的使用
版权声明:未经允许,随意转载,请附上本文链接谢谢(づ ̄3 ̄)づ╭❤~ https://blog.csdn.net/xiaoduan_/article/details/79730428SQLContext与HiveContext的使用SQLContext的使用SQLContext在Spark1.6中使用,在spark2.x中已经标记为过时,不推荐使用。示例代码pa...原创 2018-03-28 17:00:52 · 9889 阅读 · 2 评论 -
RDD转DataFrame的两种方法
版权声明:未经允许,随意转载,请附上本文链接谢谢(づ ̄3 ̄)づ╭❤~ https://blog.csdn.net/xiaoduan_/article/details/79809225RDD转DataFrame的两种方法使用反射来推断包含特定类型对象的 RDD 的模式(Inferring the Schema Using Reflection) The first metho...原创 2018-04-03 21:03:29 · 648 阅读 · 0 评论 -
Spark的4种运行模式
版权声明:未经允许,随意转载,请附上本文链接谢谢(づ ̄3 ̄)づ╭❤~ https://blog.csdn.net/xiaoduan_/article/details/79809247Spark的4种运行模式模式简介Spark支持4中运行模式,分别是local Standalone YARN 和 Mesos 1. Local:建议开发的时候使用,在本地IDE中便于编码和调试 ...原创 2018-04-03 21:04:58 · 854 阅读 · 0 评论 -
SparkSQL并行度参数设置方法
版权声明:未经允许,随意转载,请附上本文链接谢谢(づ ̄3 ̄)づ╭❤~ https://blog.csdn.net/xiaoduan_/article/details/79809262SparkSQL并行度参数设置方法SparkSQL并行度是SparkSQL的第一个调优点,默认的并行度是200,需要根据实际情况进行设置,它有有两种设置方法, 1. 在代码中直接设定val spa...原创 2018-04-03 21:06:02 · 11808 阅读 · 0 评论 -
Spark-shell启动的时候报Error while instantiating ‘org.apache.spark.sql.hive.HiveSessionStateBuilder’错误
版权声明:未经允许,随意转载,请附上本文链接谢谢(づ ̄3 ̄)づ╭❤~ https://blog.csdn.net/xiaoduan_/article/details/79815692Spark-shell启动的时候报java.lang.IllegalArgumentException: Error while instantiating ‘org.apache.spark.sql.hive...原创 2018-04-04 12:21:35 · 8368 阅读 · 7 评论