自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 org.apache.flink.core.fs.UnsupportedFileSystemSchemeException

目录一、错误二、现象三、原因四、解决方案一、错误Caused by: org.apache.flink.core.fs.UnsupportedFileSystemSchemeException: Could not find a file system implementation for scheme ‘hdfs’. The scheme is not directly suppo...

2019-12-14 16:32:32 3340 1

原创 Hadoop总结之HDFS

目录:一、HDFS是什么二、HDFS核心工作机制三、客户端上传数据到HDFS流程图四、HDFS下载数据流程图五、Checkpoint机制六、HDFS的优缺点一、HDFS是什么HDFS是一个分布式文件系统(管理服务:提供文件的读取服务、写入服务、查看目录信息服务)二、HDFS核心工作机制HDFS是一套分布式软件系统,里面有很多服务角色:namenode、datanode、seco...

2019-12-12 16:28:51 197 1

原创 Hive教程一

目录1、什么是Hive2、Hive的优缺点3、Hive架构原理4、Hive和数据库比较1、什么是Hive       Hive:由于Facebook开源用于解决海量结构化日志的数据统计(海量的结构化数据的运算分析)。       Hive是基于Hadoop的一个数据仓库工具(服务性的软件),可以将结构化的数据文件映射为一张表,并提供类似与SQL查询,HQL。       

2020-07-24 17:26:31 158

原创 【jdk】为什么我的环境变量每天需要去点击一次确定才能使用

目录一、错误二、现象三、原因四、解决方案一、错误安装好jdk以后,在cmd窗口输入javac命令,显示不是内部或外部命令二、现象win10下每次开机在cmd输入javac 都提示不是内部命令。打开环境变量,什么也不修改点一下确认再输入才能用。三、原因JAVA_HOME:Path:四、解决方案在Path变量后面加一个反斜杠配置完成,重启问题解决...

2020-02-18 01:34:01 526

原创 Caused by: java.nio.channels.UnresolvedAddressException 连接不了kafka

目录一、错误二、现象三、原因四、解决方案一、错误java.io.IOException: Can’t resolve address: rh2288-06:9092Caused by: java.nio.channels.UnresolvedAddressException二、现象连接kafka连接不上,一直报这两个错我检查了好几台机器域名映射都有,但是这个错一直在报三、原...

2020-01-14 11:23:56 4413

原创 org.apache.spark.SparkException: A master URL must be set in your configuration

目录:1、问题2、现象3、原因4、解决方案1、问题org.apache.spark.SparkException: A master URL must be set in your configuration2、现象运行代码时候报错3、原因没有在配置中设置URL4、解决方案SparkConf sparkConf = new SparkConf().setAppName(“...

2020-01-14 11:10:54 227

原创 Could not find implicit value for parameter spark:org.apache.sql.SparkSession

目录:1、问题2、现象3、原因4、解决方案1、问题Could not find implicit value for parameter spark:org.apache.sql.SparkSession2、现象找不到参数spark的隐式值:org.apache.sql.SparkSession3、原因代码中没有写隐士参数,运行时候报错4、解决方案implicit va...

2019-12-18 18:33:07 460

原创 Spark Exception: Task Not Serializable

目录:1、问题2、现象3、原因4、解决方案1、问题Spark Exception: Task Not Serializable2、现象运行代码抛出异常,意思是没有序列化3、原因常见的原因是代码里引用定义的方法,定义的方法不能序列化4、解决方案方案一:在class 或者object上面extends serialize方案二:val conf = new Spark...

2019-12-18 18:28:52 302

原创 java.io.FileNotFountException:

目录:1、问题2、现象3、原因4、解决方案1、问题java.io.FileNotFountException:File does not exist:hdfs://master:9000/sparkHistoryLogs2、现象spark-on-yarn错误,spark-on-yarn提交任务时候出现文件找不到,exitcode=153、原因查看日志,发现少一个文件夹4...

2019-12-18 18:24:14 259

原创 org.apache.hadoop.security.AccessControlException

目录:1、问题2、现象3、原因4、解决方案1、问题org.apache.hadoop.security.AccessControlException: Permission denied: user=Lenovo, access=WRITE, inode="/":root:supergroup:drwxr-xr-x2、现象报错,文件上传hdfs不成功3、原因Hdfs中的/u...

2019-12-18 10:52:48 229

原创 Spark Streaming 性能调优

目录1、合理的批次处理时间2、合理的kafka拉取数据3、缓存反复使用的Dstream(RDD)4、其他一些优化策略5、结果1、合理的批次处理时间关于Spark Streaming的批处理时间设置是非常重要的,Spark Streaming在不断接收数据的同时,需要处理数据的时间,所以如果设置过段的批处理时间,会造成数据堆积,即未完成的batch数据越来越多,从而发生阻塞。另外值...

2019-12-18 10:45:53 615

原创 Hadoop总结之MapReduce

目录一、简介二、WordCount三、setup与cleanup四、Combiner五、MapReduce中shuffle六、MapReduce处理数据倾斜的一些方法七、MapReduce内部处理数据流程一、简介MapReduce计算框架将计算过程分为两个阶段:Map和Reduce  Map阶段并行处理输入数据;  Reduce阶段对Map结果进行汇总Shuffle连接...

2019-12-14 16:55:31 284

原创 联想笔记本电脑修改CPU虚拟化

联想笔记本电脑,如何进入BIOS?修改CPU虚拟化1.进入BIOS,开机时按F2或者F12或者DEL或ESC等键2.进入BIOS后,找到Configuration选项,选择 Intel Virtual Technology并回车,将光标移至Enabled,然后再回车,最后按F10保存并退出。...

2019-12-14 16:37:21 2460

原创 Multiple MySQL running but PID file could not be found解决方案

目录:一、问题二、现象三、原因四、解决方案一、问题Multiple MySQL running but PID file could not be found二、现象当你启动或者重启 MySQL 时,报关于PID file 的错误三、原因第一种:PID被干掉了第二种:路径问题四、解决方案第一种:ps aux | grep mysql找到mysql进程中带有pid...

2019-12-12 16:40:20 1031

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除