徐程序猿-CSDN博客

原创 org.apache.flink.core.fs.UnsupportedFileSystemSchemeException

目录一、错误二、现象三、原因四、解决方案一、错误Caused by: org.apache.flink.core.fs.UnsupportedFileSystemSchemeException: Could not find a file system implementation for scheme ‘hdfs’. The scheme is not directly suppo...

2019-12-14 16:32:32 3671 1

原创 Hadoop总结之HDFS

目录：一、HDFS是什么二、HDFS核心工作机制三、客户端上传数据到HDFS流程图四、HDFS下载数据流程图五、Checkpoint机制六、HDFS的优缺点一、HDFS是什么HDFS是一个分布式文件系统(管理服务：提供文件的读取服务、写入服务、查看目录信息服务)二、HDFS核心工作机制HDFS是一套分布式软件系统，里面有很多服务角色：namenode、datanode、seco...

2019-12-12 16:28:51 350 1

原创 Hive教程一

目录1、什么是Hive2、Hive的优缺点3、Hive架构原理4、Hive和数据库比较1、什么是Hive Hive：由于Facebook开源用于解决海量结构化日志的数据统计(海量的结构化数据的运算分析)。 Hive是基于Hadoop的一个数据仓库工具(服务性的软件)，可以将结构化的数据文件映射为一张表，并提供类似与SQL查询，HQL。

2020-07-24 17:26:31 260

原创【jdk】为什么我的环境变量每天需要去点击一次确定才能使用

目录一、错误二、现象三、原因四、解决方案一、错误安装好jdk以后，在cmd窗口输入javac命令，显示不是内部或外部命令二、现象win10下每次开机在cmd输入javac 都提示不是内部命令。打开环境变量，什么也不修改点一下确认再输入才能用。三、原因JAVA_HOME：Path：四、解决方案在Path变量后面加一个反斜杠配置完成，重启问题解决...

2020-02-18 01:34:01 633

原创 Caused by: java.nio.channels.UnresolvedAddressException 连接不了kafka

目录一、错误二、现象三、原因四、解决方案一、错误java.io.IOException: Can’t resolve address: rh2288-06:9092Caused by: java.nio.channels.UnresolvedAddressException二、现象连接kafka连接不上，一直报这两个错我检查了好几台机器域名映射都有，但是这个错一直在报三、原...

2020-01-14 11:23:56 4688

原创 org.apache.spark.SparkException: A master URL must be set in your configuration

目录：1、问题2、现象3、原因4、解决方案1、问题org.apache.spark.SparkException: A master URL must be set in your configuration2、现象运行代码时候报错3、原因没有在配置中设置URL4、解决方案SparkConf sparkConf = new SparkConf().setAppName(“...

2020-01-14 11:10:54 286

原创 Could not find implicit value for parameter spark：org.apache.sql.SparkSession

目录：1、问题2、现象3、原因4、解决方案1、问题Could not find implicit value for parameter spark：org.apache.sql.SparkSession2、现象找不到参数spark的隐式值：org.apache.sql.SparkSession3、原因代码中没有写隐士参数，运行时候报错4、解决方案implicit va...

2019-12-18 18:33:07 591

原创 Spark Exception: Task Not Serializable

目录：1、问题2、现象3、原因4、解决方案1、问题Spark Exception: Task Not Serializable2、现象运行代码抛出异常，意思是没有序列化3、原因常见的原因是代码里引用定义的方法，定义的方法不能序列化4、解决方案方案一：在class 或者object上面extends serialize方案二：val conf = new Spark...

2019-12-18 18:28:52 405

原创 java.io.FileNotFountException:

目录：1、问题2、现象3、原因4、解决方案1、问题java.io.FileNotFountException:File does not exist:hdfs://master:9000/sparkHistoryLogs2、现象spark-on-yarn错误，spark-on-yarn提交任务时候出现文件找不到，exitcode=153、原因查看日志，发现少一个文件夹4...

2019-12-18 18:24:14 350

原创 org.apache.hadoop.security.AccessControlException

目录：1、问题2、现象3、原因4、解决方案1、问题org.apache.hadoop.security.AccessControlException: Permission denied: user=Lenovo, access=WRITE, inode="/":root:supergroup:drwxr-xr-x2、现象报错，文件上传hdfs不成功3、原因Hdfs中的/u...

2019-12-18 10:52:48 297

原创 Spark Streaming 性能调优

目录1、合理的批次处理时间2、合理的kafka拉取数据3、缓存反复使用的Dstream(RDD)4、其他一些优化策略5、结果1、合理的批次处理时间关于Spark Streaming的批处理时间设置是非常重要的，Spark Streaming在不断接收数据的同时，需要处理数据的时间，所以如果设置过段的批处理时间，会造成数据堆积，即未完成的batch数据越来越多，从而发生阻塞。另外值...

2019-12-18 10:45:53 779

原创 Hadoop总结之MapReduce

目录一、简介二、WordCount三、setup与cleanup四、Combiner五、MapReduce中shuffle六、MapReduce处理数据倾斜的一些方法七、MapReduce内部处理数据流程一、简介MapReduce计算框架将计算过程分为两个阶段：Map和Reduce　　Map阶段并行处理输入数据；　　Reduce阶段对Map结果进行汇总Shuffle连接...

2019-12-14 16:55:31 381

原创联想笔记本电脑修改CPU虚拟化

联想笔记本电脑，如何进入BIOS？修改CPU虚拟化1.进入BIOS，开机时按F2或者F12或者DEL或ESC等键2.进入BIOS后，找到Configuration选项，选择 Intel Virtual Technology并回车，将光标移至Enabled，然后再回车，最后按F10保存并退出。...

2019-12-14 16:37:21 4126

原创 Multiple MySQL running but PID file could not be found解决方案

目录：一、问题二、现象三、原因四、解决方案一、问题Multiple MySQL running but PID file could not be found二、现象当你启动或者重启 MySQL 时，报关于PID file 的错误三、原因第一种：PID被干掉了第二种：路径问题四、解决方案第一种：ps aux | grep mysql找到mysql进程中带有pid...

2019-12-12 16:40:20 1248

weixin_42879643的博客