森屿旅人996-CSDN博客

原创 spark报java.lang.NoSuchMethodError: io.netty.buffer.PooledByteBufAllocator.defaultNumHeapArena()I

spark2.4.6与scala2.11.12运行程序过程中，遇到了netty版本冲突或包缺失导致程序出现NoSuchMethodError异常，报错如下：Exception in thread “main” java.lang.NoSuchMethodError: io.netty.buffer.PooledByteBufAllocator.defaultNumHeapArena()I20/07/13 12:50:55 INFO SecurityManager: SecurityManager: au

2020-07-13 13:57:04 1988 3

原创 spark2.4.6报 java.io.FileNotFoundException

**spark2.4.6报 java.io.FileNotFoundException**提示：WARN TaskSetManager: Lost task 1.0 in stage 0.0 (TID 1, 172.16.50.32, executor 1):java.io.FileNotFoundException: File file:/home/hadoop/input/wc.txt does not exist在确认文件存在的情况下，出现这个问题的原因是：我们是在集群上运行wordcoun

2020-07-02 14:04:33 2348

原创 python pandas中关于DataFrame行、列显示不完全的解决方法

DataFrame中的行列数量太多，print打印出来会显示不完全解决办法：#显示所有列pd.set_option('display.max_columns', None)#显示所有行pd.set_option('display.max_rows', None)#设置value的显示长度为200，默认为50pd.set_option('max_colwidth',200)即可解决字段内容显示不完整，行或列显示不全问题...

2021-03-20 14:32:08 1399

原创 Linux命令查看文件指定行的内容

Linux如何显示文件指定行数的内容的方法，有如下几种方法：tail -n +/-数字文件名head -n 数字文件名sed -n “开始行，结束行p” 文件名下面分别具体介绍这几种方法如何使用：tail -n +数字文件名表示查看文件的某一行到最后一行，比如查看helloworld.txt的第3行到最后一行:tail -n +3 helloworld.txttail -n -数字文件名表示查看文件的最后几行，比如查看helloworld.txt的最后5行:tail -n

2020-10-21 19:57:13 6243

原创 ip地址与long数值互相转换

IPv4地址是一个32位的二进制数，通常被分割位4个“8位二进制数”一、将ip地址转成long数值将IP地址转化成整数的方法如下：1、通过String的split方法按.分隔得到4个长度的数组2、通过左移位操作（<<）给每一段的数字加权，第一段的权为2的24次方，第二段的权为2的16次方，第三段的权为2的8次方，最后一段的权为1二、将数值转换为ip地址将整数形式的IP地址转化成字符串的方法如下：1、将整数值进行右移位操作（>>>），右移24位，右移时高位补0，得到

2020-09-29 21:05:59 2356

原创 MySQL安装后在服务里找不到或者服务启动不起来解决方法

1.打开命令行，进入到MySQL服务的根目录下的bin里执行：mysqld.exe -install 成功了会出现安装成功的提示，不成功可能是因为你的权限不够，则用管理员权限打开命令，执行该操作2.安装完成后启动，再次执行 net start Mysql 会提示服务正在启动...

2020-09-29 20:21:27 590

原创 java实现:给定整数数组，使其各个数字整体向后移动N个位置

题目：给定整数数组，使其各个数字整体向后移动N个位置，如果后移的位置超过整数数组的长度，则将该数字从头开始继续后移示例输入：[1,2,3,4,5,6,7,8,9,10,11,12,13,14],17示例输出：[12, 13, 14, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]代码实现：package shenzhoushuma;import java.io.BufferedReader;import java.io.IOException;import java.

2020-09-29 19:57:22 1128

原创给定一字符串，求出现次数最多的那个字符及次数，如次数最多的字符有多个则都输出

题目：给定一字符串，求出现次数最多的那个字符及次数，如次数最多的字符有多个则都输出思路：1.首先读取字符串中的第一个字符，将字符串中与第一个字符相同的字符全部删除掉，然后通过计算删除前后字符串的长度差来确定该字符在字符串中出现的次数，最终比较出出现最多次的字符2.设置一个list集合存储出现次数最多的字符，max_num记录出现最多的次数(1)如果删除前后的字符串长度差等于前一次max_num，则添加到list(2)如果删除前后的字符串长度差大于前一次max_num，清空list，更新max_s

2020-09-29 19:56:21 1251

原创方法的覆盖和重载有什么区别

重载与覆盖的区别1、方法的覆盖是子类和父类之间的关系，是垂直关系；方法的重载是同一个类中方法之间的关系，是水平关系2、覆盖只能由一个方法，或只能由一对方法产生关系；方法的重载是多个方法之间的关系3、覆盖要求参数列表相同；重载要求参数列表不同4、覆盖关系中，调用那个方法体，是根据对象的类型（对象对应存储空间类型）来决定；重载关系，是根据调用时的实参表与形参表来选择方法体的override可以翻译为覆盖，从字面就可以知道，它是覆盖了一个方法并且对其重写，以求达到不同的作用。对我们来说最熟悉的覆盖就是对

2020-09-23 14:29:49 6762

原创 spark与MongoDB联合使用报catalyst.analysis.TypeCoercion$.findTightestCommonTypeOfTwo()Lscala/Function2

报错如下：java.lang.NoSuchMethodError: org.apache.spark.sql.catalyst.analysis.TypeCoercion$.findTightestCommonTypeOfTwo()Lscala/Function2;java.lang.NoSuchMethodError: org.apache.spark.sql.catalyst.analysis.TypeCoercion$.findTightestCommonTypeOfTwo()Lscala/Fun

2020-08-17 18:11:48 499

原创 Pycharm安装教程（图文详细）

下载安装包Pycharm官网下载安装包，这里附上链接pycharm官网下载链接开始安装1.双击“pycharm-professional-2020.1.3.exe”进入到软件安装向导界面，如下图，点击“next”2.设置安装目录，默认安装在C盘，建议安装在D盘，然后点击“next”3.根据自身需求参照勾选，建议勾选图示的两个选项就可以，然后点击“next”4.然后点击“install”5.点击“finish”,安装就完成了...

2020-08-04 17:57:19 8330

原创在hive中，使用动态分区插入数据报dynamic.partitions.pernode. Maximum was set to: 100

报错如下：The maximum number of dynamic partitions is controlled by hive.exec.max.dynamic.partitions and hive.exec.max.dynamic.partitions.pernode. Maximum was set to: 100报错原因：hive shell中默认的参数hive.exec.max.dynamic.partitions.pernodehive.exec.max.dynamic.par

2020-07-28 11:27:32 2712

原创在hive中把查询出来的数据导入数据表时报FAILED: SemanticException [Error 10096]: Dynamic partition strict mode...

报错如下：hive (sdw_data)> insert overwrite table SDW_DATA.SDW_LOAN_DK > partition(LN_DB_PART_ID)select * from SDA_DATA.SDA_CBOD_LNLNSLNS ;FAILED: SemanticException [Error 10096]: Dynamic partition strict mode requires at least one stat

2020-07-28 10:14:52 2315

原创 IDEA中运行SparkSql报javax.jdo.JDOFatalInternalException: Error creating transactional connection factory

在IDEA中运行SparkSql，报错如下20/07/20 21:16:25 WARN HiveMetaStore: Retrying creating default database after error: Error creating transactional connection factoryjavax.jdo.JDOFatalInternalException: Error creating transactional connection factory at org.datanuc

2020-07-20 21:34:41 1529

原创启动SparkSql，报javax.jdo.JDOFatalInternalException: Error creating transactional connection factory

启动SparkSql，报错如下：20/07/20 08:02:48 WARN metastore.HiveMetaStore: Retrying creating default database after error: Error creating transactional connection factoryjavax.jdo.JDOFatalInternalException: Error creating transactional connection factoryNestedThro

2020-07-20 20:57:04 1840

原创 sqoop1.4.7报ERROR hive.HiveConfig: Could not load org.apache.hadoop.hive.conf.HiveConf.

使用sqoop从mysql向hive中导入数据报错如下：20/07/18 04:13:38 ERROR hive.HiveConfig: Could not load org.apache.hadoop.hive.conf.HiveConf. Make sure HIVE_CONF_DIR is set correctly.20/07/18 04:13:38 ERROR tool.ImportTool: Import failed: java.io.IOException: java.lang.Clas

2020-07-18 19:49:45 427 1

原创 hbase环境搭建及集群的安装部署

搭建HBase环境HBase安装部署1.环境准备1）正确安装JDK并正确设置环境变量2）正确安装Hadoop并正确设置环境变量3）正确安装ZooKeeper并正确设置环境变量2.HBase 安装及配置1）把 hbase-1.4.5-bin.tar.gz 上传到linux的/home/hadoop/ 目录下2）解压 hbase-1.4.5-bin.tar.gz 到/opt/wdp/目录下面[hadoop@hrbu30 ~]$ tar -zxvf hbase-1.4.5-bin.tar.gz

2020-07-17 17:22:44 247

原创 Win10配置MySQL的环境变量

1.右键点击“此电脑”，然后点击“属性”，选择“高级系统设置”，然后点击“环境变量”，选择新建2.设置变量名为“MYSQL_HOME”,变量值为自己安装mysql服务的路径3.双击“path”4.点击新建，添加mysql的环境变量，最后点击确定即可，这样环境变量就配置完了...

2020-07-17 11:47:47 3767

原创 MySQL5.7.31安装配置（图文详细教程）

下载MySQL安装包，选择自己需要的版本，我用的是5.7.31下载链接：https://dev.mysql.com/downloads/windows/installer/5.7.html安装包下载1.选择版本，点击download下载2.弹出一个页面，点击”No thanks…”,进行下载3.找到下载的文件，双击文件名称，进行安装开始安装1.选择适合自己的模式，我选择的是自定义安装，然后Next2.根据自己的系统选择是X64还是X86 ，我是X64位系统，所以选择移除所有X86的组

2020-07-17 11:36:21 29892 6

原创启动hive时报ls: 无法访问/opt/wdp/spark/lib/spark-assembly-*.jar: 没有那个文件或目录

报错如下： ls: 无法访问/opt/wdp/spark/lib/spark-assembly-*.jar: 没有那个文件或目录[root@hrbu30 hive]# hivels: 无法访问/opt/wdp/spark/lib/spark-assembly-*.jar: 没有那个文件或目录Logging initialized using configuration in jar:file:/opt/wdp/hive/lib/hive-common-1.2.2.jar!/hive-log4j.pr

2020-07-16 18:01:10 356

原创 hive报java.lang.RuntimeException

报错如下：Exception in thread “main” java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient报错原因：Metastore默认存储在自带的derby数据库中，derby是一种单用户独占式轻量级数据库，当一个derby数据库被使用时，其他用户就无法再使用此数

2020-07-16 15:11:56 1296

原创 Hive环境搭建与mysql数据库安装

首先，准备好hive安装包，下载hive安装包官方地址：hive安装包下载链接Hive安装1.把下载下来的安装包 apache-hive-1.2.2-bin.tar.gz 上传到 linux 的/home/hadoop/ 目录下2.解压 apache-hive-1.2.2-bin.tar.gz 到/opt/wdp/目录下面[hadoop@hrbu30 ~]$ tar -zxvf apache-hive-1.2.2-bin.tar.gz -C /opt/wdp/3.修改 apache-hive-

2020-07-16 14:20:35 641

原创删除硬盘出厂预留的磁盘空间

1.打开windows运行（win+R）2.输入命令"diskpart",回车3.输入命令"list disk",查看分区属于哪一个磁盘4.输入命令"select disk N"选择所选磁盘（N为所要删除分区的磁盘，如果分区的磁盘为3，那么输入的命令即为"select disk 3"）5.然后输入执行命令"clean",即可完全清除没用的分区，就搞定了...

2020-07-14 21:11:20 285

原创 spark报org.apache.spark.SparkException: Exception thrown in awaitResult异常

运行spark程序时，报错如下20/07/13 16:09:39 INFO SparkUI: Bound SparkUI to 0.0.0.0, and started at http://DESKTOP-27NPJ0G:404020/07/13 16:09:39 INFO SparkContext: Added JAR D:\Software\java\WorkSpace\hrbuspark\target\SparkWordCount.jar at spark://DESKTOP-27NPJ0G:53

2020-07-13 16:18:52 8699

原创 spark在yarn模式下运行程序报running beyond virtual memory limits

错误提示：Diagnostics: Container [pid=5677,containerID=container_e01_1594549493537_0002_02_000001] is running beyond virtual memory limits. Current usage: 269.4 MB of 1 GB physical memory used; 2.3 GB of 2.1 GB virtual memory used. Killing container.20/07/12

2020-07-12 20:32:42 932

原创 Spark启动时报JAVA_HOME is not set异常

Spark启动时报JAVA_HOME is not set异常报错提示：starting org.apache.spark.deploy.master.Master, logging to /opt/wdp/spark/logs/spark-hadoop-org.apache.spark.deploy.master.Master-1-hrbu30.outhrbu32: starting org.apache.spark.deploy.worker.Worker, logging to /opt/wdp

2020-07-12 16:42:52 2016

原创 Spark环境搭建之standalone模式安装

Standalone模式: 即构建一个由Master+Slave构成的Spark集群，Spark运行在集群中。standalone模式安装spark安装包下载地址官网下载链接1.上传并解压spark安装包,改文件夹名称，便于使用[hadoop@hrbu30 ~]$ tar -zxvf spark-2.4.6-bin-hadoop2.7.tgz -C /opt/wdp/[hadoop@hrbu30 wdp]$ mv spark-2.4.6-bin-hadoop2.7 spark2.进入spar

2020-07-12 14:15:44 429

原创 ZooKeeper的分布式模式的安装与配置

Zookeeper是一个开源的分布式的，为分布式应用提供协调服务的Apache项目。Zookeeper从设计模式角度来理解：是一个基于观察者模式设计的分布式服务管理框架，它负责存储和管理大家都关心的数据，然后接受观察者的注册，一旦这些数据的状态发生变化，Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应，从而实现集群中类似Master/Slave管理模式。Zookeeper=文件系统+通知机制1.集群规划，我准备在hrbu30、hrbu31和hrbu32三个节点上部

2020-07-11 21:33:39 259

森屿旅人996的博客