问题解决
文章平均质量分 86
RunningShare
这个作者很懒,什么都没留下…
展开
-
livy(0.5) on zeppelin(0.8)报No YARN application is found with tag问题解决
文章目录环境信息代码报错livy日志报No YARN application is found with tag排查尝试远程调试远程调试步骤远程调试结果尝试修改超时参数转换思路:发现不在同一个机房的网络总结环境信息livy(0.5) on zeppelin(0.8)代码%livysc.range(1,10).sum()报错livy日志报No YARN application is found with tag21/05/13 15:34:41 INFO RSCClient: Failin原创 2021-05-17 09:57:43 · 1203 阅读 · 0 评论 -
一次MR作业Task数过多导致的集群阻塞的问题排查
一次MR作业Task数过多导致的集群阻塞的问题排查问题背景集群出现一百多个任务排队,运行中的任务一百多个,bi的同事反馈大量任务延迟一万多秒以下截图不全排查问题通过RM页面、spacex的监控、active的RM机器的负载和日志观察,确认ResourceManager目前状态正常通过spacex的app监控发现集群在早上8.45的时候提交大量的任务阻塞的任务基本都跑在root.bi_queue.bi_base 这个队列中,这个队列资源基本满了大概排查方向确认增加了大量任务导致集群资原创 2021-05-11 15:28:35 · 929 阅读 · 0 评论 -
提交依赖第三方Source的Flink作业时报NoClassDefFoundError问题解决
报错信息java.lang.NoClassDefFoundError: org/apache/flink/streaming/connectors/wikiedits/WikipediaEditsSource at com.hadoops.jackson.flink.demo.WikipediaAnalysis.main(WikipediaAnalysis.java:34) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)原创 2020-12-24 18:04:58 · 1709 阅读 · 2 评论 -
HBase的master显示的注册上的RegionServer主机名和别名同时存在的问题
问题描述现象master的WebUI截图截图描述图中红色选中的部分为配置的RS机器的别名1.hbase-1.2.2/conf/regionservers中无论配置别名和配置主机名,master的webui中RegionServer的列表都同时存在别名和主机名的RS日志其中一个RegionServer的日志显示RegionServer注册的主机名和master给出的主机名不一致regionserver.HRegionServer: Master pas..原创 2020-08-20 17:48:48 · 1386 阅读 · 0 评论 -
电脑双屏变单屏后,界面显示问题
一开始电脑连了显示器,然后将一个软件在显示器里打开显示,结果电脑变成单屏后,竟然没显示出来,一开始还以为是软件出了问题,后面发现不是这个原因,其实软件是打开来了,只是没有在电脑可见界面显示出来。 解决办法如下启动软件,启动以后别点别的地方,以便让软件拥有焦点。按 Alt + 空格,然后按 M 。按一下随便什么方向键,比如左。移动鼠标。————————————————版权声明:本文为CSDN博主「ccc_12345」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接转载 2020-06-25 19:04:08 · 3363 阅读 · 1 评论 -
Java日常问题诊断方法
日志检索#检索exception关键字或error关键字grep-E"exception|error"app.log#显示关键字上下10行日志grep-C10exceptionapp.log#检索2020-05-0519:23~25分钟段日志grep'2020-05-0519:2[3-5]'app.logsed-n'/2020-05-0519:23/,/2020-05-0519:25/p'app.log#检索202...转载 2020-05-29 11:11:32 · 365 阅读 · 0 评论 -
The reference to entity "useSSL" must end with the ';' delimiter.
在搭建测试环境的hive的时候,发现启动的时候,经常报以下警告信息Thu May 14 09:52:26 CST 2020 WARN: Establishing SSL connection without server's identity verification is not recommended. According to MySQL 5.5.45+, 5.6.26+ and 5.7.6+ requirements SSL connection must be established by原创 2020-05-14 10:10:40 · 1629 阅读 · 0 评论 -
java Metaspace频繁FGC问题定位
问题描述数据服务是通过SQL对外提供数据查询的服务平台,底层存储支持HBase和MySQL两种。用户首先在管理平台上配置好接口的SQL详情SQL接口配置业务方通过微服务接口根据生成的ID以及接口参数来完成数据的查询,由于HBase不支持SQL引擎的查询,我们基于calcite实现了一套简单的SQL On HBase解析逻辑。查看笔者前面的文章可以看到堆空间内存泄露的文章,...转载 2020-03-19 17:40:41 · 1209 阅读 · 2 评论 -
hdfs上传文件没有权限写入的问题解决put: Permission denied: user=root, access=WRITE
问题:如题,在上传文件的时候出现没有权限写入的问题:命令: hdfs dfs -put dummy_log_data /user/impala/data/logs/year=2013/month=07/day=28/host=host1报错信息:put: Permission denied: user=root, access=WRITE, inode="/user/im...原创 2020-02-17 22:42:53 · 3946 阅读 · 0 评论 -
CDH6.2.1安装主机已受管却无法选择主机的问题解决
背景:如题,在安装CDH6.2.1的时候,进行到下载parcel到各个节点时卡了,配置的本地parcel,结果发现下载远程的,重新配置后提示我有风险,结果手残选了删除集群,这会节点识别出来后无法继续了解决:进入CM的Host页面: 正在上传…重新上传取消正在上传…重新上传取消http://cm机器:7180/ ...原创 2020-02-17 17:08:33 · 3938 阅读 · 3 评论 -
CDH6.2.1安装Kudu maste无法启动 Unable to initialize catalog manager
今天装完cdh后,启动Kudu的master发现报了以下错误:凌晨12点28:30.722分 INFO cc:313 Webserver started. Bound to: http://0.0.0.0:8051/凌晨12点28:30.727分 INFO cc:188 Verifying existing consensus state凌晨12点28:30.727分 ERROR c...原创 2020-02-17 11:05:50 · 2865 阅读 · 0 评论 -
cdh6.2.1安装时账户免密登录验证失败问题解决
如题,在安装cdh6.2.1时,在验证agent主机的免密账号时,一直验证失败,打开日志显示2020-02-16 19:09:08,856 INFO NodeConfiguratorThread-10-0:com.cloudera.server.cmf.node.NodeConfiguratorProgress: hadoop08-test1-rgtj1-tj1: Setting AUT...原创 2020-02-16 19:31:52 · 2943 阅读 · 2 评论 -
CDH6.2.1安装时出现Error: Multilib version problems found Protected multilib versions: libcom_err 问题
如题,在执行启动agent相关进程的时候报了如下错误:Error: Multilib version problems found. This often means that the root cause is something else and multilib version checking is just pointing out that ther...原创 2020-02-16 17:17:58 · 1117 阅读 · 0 评论 -
CDH6.2.1安装时cloudera-scm-server无法启动出现JDK版本不兼容问题
如题,今天在测试环境安装CDH6.2.1时,cloudera-scm-server无法启动,查看日志文件/var/log/cloudera-scm-server/cloudera-scm-server.out,发现以下输出:+======================================================================+| Error...原创 2020-02-16 17:01:03 · 4052 阅读 · 3 评论 -
mysql 5.7.23忘记密码情况下重新设置root密码
使用FTP工具下载/etc/my.cnf到本地电脑 也可以使用vi编辑,因为怕改乱了,我这里先下载到本地电脑修改,再覆盖服务器源文件 在 [mysqld] 段落中添加 skip-grant-tables 使数据库跳过密码验证 重启数据库,使刚修改配置生效service mysqld reload或/etc/init.d/mysqld restart...转载 2020-01-19 15:46:47 · 309 阅读 · 0 评论 -
MYSQL---Expression #1 of ORDER BY clause is not in GROUP BY clause and contains nonaggregated column
--数据库中插入数据或执行sql语句时一直报下面这个错误:Expression #1 of ORDER BY clause is not in GROUP BY clause and contains nonaggregated column 'information_schema.PROFILING.SEQ' which is not functionally dependent on c...转载 2020-01-19 11:07:05 · 1078 阅读 · 0 评论 -
记一次DataNode挂掉导致NameNode显示大量坏块的问题处理
目录背景:所需知识:坏块处理:批量删除坏块总结:未解决疑问:背景:测试环境今天有人反馈有DataNode节点挂掉有部分block不能用的问题,看了下确实active的NN页面显示有52336个坏块,且看datanode节点列表有个节点是Dead状态,不过仔细一看发现stanby的NN的页面里该DataNode是正常的。所需知识:坏块:corruptRe...原创 2020-01-10 10:21:38 · 1368 阅读 · 0 评论 -
Linux 命令详解(一)export 命令
一、Windows 环境变量 1、在Windows 系统下,很多软件安装都需要配置环境变量,比如 安装 jdk ,如果不配置环境变量,在非软件安装的目录下运行javac 命令,将会报告找不到文件,类似的错误。 2、那么什么是环境变量?简单说,就是指定一个目录,运行软件的时候,相关的程序将会按照该目录寻找相关文件。 设置变量对于一般人最实用的功能就是: 不用拷贝某些dll文件到系统目录中...转载 2020-01-02 16:45:14 · 817 阅读 · 0 评论 -
miniconda文件路径更改后,activate无法激活环境,没有那个文件或目录等Python环境损坏问题解决
问题描述系统环境linux centos原本miniconda所在路径为 /usr/local/miniconda2被其他人员拷贝到 /home/python/miniconda2原路径没有miniconda了,在原路径下用conda安装的python3环境也被迁移到新路径了。使用命令source activate py3 或者 conda activate py3提示[ro...转载 2019-12-25 11:33:22 · 1841 阅读 · 2 评论 -
Centos6.6 源码安装Python依赖包h3的过程记录
目录一、背景二、源码安装过程2.1、git clone h3-py源码2.2、进入h3-py目录后修改setup.py文件中红框部分如下:2.3、修改.install.sh文件2.3.1、修改.install.sh文件为红框内容如下:2.3.2、注释h3c的git clone和删除目录部分2.4、git clone h3c 并复制到h3-py目录2.5、尝试编译...原创 2019-12-24 17:01:26 · 705 阅读 · 0 评论 -
CondaHTTPError: HTTP 000 CONNECTION FAILED for url 问题处理
今天在用conda 给虚拟环境安装Python依赖包的时候,发现有一个节点一直安装失败,试了好几个方式都不行,卸载了Python重装也装不上,报错如下:CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-...原创 2019-12-18 18:46:18 · 2252 阅读 · 0 评论 -
记hadoop集群黑名单移除节点出现问题及解决
首先区分一下通过直接下线服务和通过黑名单来移除节点的区别,这两个动作都会涉及到block副本数不够而复制移动恢复的问题,但是通过黑名单的话可以同时移除多个节点,这个是两种情况的主要区别;步骤:1.移除nodemanager在yarn-site.xml中加入以下配置<property><name>ya...转载 2019-11-29 09:37:45 · 361 阅读 · 0 评论 -
一次在idea中误删stash的代码
由于项目安排,中间开发的一些代码被我用git stash方式暂存了,今天看项目空间占用挺大,想说删除一些没用的stash的内容,就手贱点了idea里的drop,以为是删除的是选中的stash内容,结果发现全部stash的代码都没了网上找了下,主要通过以下3个步骤实现通过git fsck --lost -found :查看最近移除的文件 git show '误删编号':查看删除...原创 2019-10-30 16:09:43 · 2043 阅读 · 0 评论 -
JobHistoryServer无法正常启动
今天在测试环境启动JobHistoryServer,发现无法正常启动,报错信息如下:2019-10-28 17:44:33,030 INFO org.apache.hadoop.mapreduce.v2.hs.JobHistoryServer: registered UNIX signal handlers for [TERM, HUP, INT]2019-10-28 17:44:33,6...原创 2019-10-28 17:57:37 · 4278 阅读 · 0 评论 -
yarn中MR作业报错Java heap space
hue页面提交到hive中的作业,被转换成了MR作业运行在yarn集群中。作业报错//0,报错内容摘要我们hadoop-2.7集群用的执行引擎不是Tez,而是mr(是老集群)Error: Java heap spaceContainer killed by the ApplicationMaster.//1,查找报错日志[root@ my-hadoop-cluster hive]# ...转载 2019-10-28 16:35:01 · 574 阅读 · 0 评论 -
@JsonProperty 失效问题的排查
@JsonProperty 是Jackson提供的一个用于注解属性、类、方法等的json注解。使用它可以改变Json序列化时属性的名称,一般默认使用属性名,比如如下的代码示例,如果没有使用@JsonProperty注解那么id转化为json为{“id”:11}.使用了则就是{“Id”:11}. @JsonInclude(Include.NON_NULL) pu...转载 2019-05-07 16:09:59 · 4453 阅读 · 0 评论 -
Error resolving template template might not exist or might not be accessible
今天对工程代码结构重新做了调整,部署上去发现无法访问,报错如下:2019/04/25 08:41:02 [ERROR] [http-nio-8080-exec-8] org.apache.juli.logging.DirectJDKLog.log(DirectJDKLog.java:182) - Servlet.service() for servlet [dispatcherServ...原创 2019-04-25 18:08:16 · 1286 阅读 · 0 评论 -
Warning: bad syntax, perhaps a bogus '-'? See /usr/share/doc/procps-3.2.8/FAQ
查看Linux的进程时执行 ps -aux|grep HiveServer2|grep -v grep报一下警告信息Warning: bad syntax, perhaps a bogus '-'? See /usr/share/doc/procps-3.2.8/FAQ修改为ps aux|grep HiveServer2|grep -v grep警告问题解决。...原创 2019-05-05 20:30:29 · 1138 阅读 · 0 评论 -
从Hive的日志文件超大引出磁盘满问题并追踪出NameNode 安全模式的问题与处理
目录发现NameNode安全模式问题初步判断是磁盘满导致安全模式NameNode安全模式解释补充解释尝试重启DataNode重启NameNode总结发现NameNode安全模式问题一次偶然的机会,准备看下Hive的版本,发现无法执行hive脚本,发现Hive命令无法正常进入hive命令行,报错信息如下:ls: cannot access /usr...原创 2019-04-29 17:32:43 · 1773 阅读 · 0 评论 -
/bin/bash^M: bad interpreter: No such file or directory
今天对系统的代码结构重新划分模块,通过内部部署系统进行部署,发现报了一个错误:/bin/bash^M: bad interpreter: No such file or directory看这情况应该是和编码有关,以为自己的文件编码有问题,重新设置编码再上传,还是一样报错,就想说在Linux里直接打印文件编码格式,通过以下命令打印在Vim中可以直接查看文件编码:set fileenc...原创 2019-04-24 20:05:45 · 3310 阅读 · 0 评论 -
Spring Boot中Jackson ObjectMapper应用详解
Spring Boot支持与三种JSON mapping库集成:Gson、Jackson和JSON-B。Jackson是首选和默认的。Jackson是spring-boot-starter-json的一部分,spring-boot-starter-web中包含spring-boot-starter-json。也就是说,当项目中引入spring-boot-starter-web后会自动引入...转载 2019-05-07 18:06:29 · 5332 阅读 · 3 评论 -
idea properties文件乱码解决方案
设置以下几个地方1、全局编码2、工程编码3、默认properties文件编码4、转换编码原创 2019-05-10 18:20:04 · 708 阅读 · 0 评论 -
Mat 无法解析dump文件:Dominator tree not available. Open the Dominator Tree or delete indices and parse aga
打算用Mat分析dump文件的时候发现报错Dominator tree not available. Open the Dominator Tree or delete indices and parse again.查了下发现dump文件的同级目录存在一些临时文件,把临时文件删了就可以打开dump文件进行分析了...原创 2019-05-24 15:03:07 · 2916 阅读 · 0 评论 -
诡异的hdfs dfs -ls /无法执行 提示远程调试
目录执行查看hdfs目录命令发现无法查看,停在远程调试lsof -i:查出进程id,再找出对应的进程在bin/hdfs脚本中找到对应的远程调试把远程调试的参数去掉即可。今天在生产排查磁盘满问题的时候,发现无法查看生产的hdfs目录执行查看hdfs目录命令发现无法查看,停在远程调试 /usr/local/hadoop-2.6.3/bin/hdfs dfs -ls /...原创 2019-05-16 20:06:33 · 2156 阅读 · 0 评论 -
Could not attach to PID 问题解决
今天用jstat -gcutil pid 3000 1000 的时候发现无法执行Could not attach to pid查了下发现原来进程启动用户和自己jstat的用户不是同一个,切换该用户或者sudo jstat -gcutil pid 3000 1000 即可。...原创 2019-05-23 14:29:59 · 17874 阅读 · 1 评论 -
大量删除hdfs历史文件导致全部DataNode心跳汇报超时为死亡状态问题解决
目录背景:问题产生过程:问题现象:解决过程:相关日志:其他方案:总结:背景:由于测试环境的磁盘满了,导致多个NodeManager出现不健康状态,查看了下,基本都是data空间满导致,不是删除日志文件等就能很快解决的,只能删除一些历史没有用的数据。于是从大文件列表中,找出2018年的spark作业的历史中间文件并彻底删除(跳过回收站)/usr/loc...原创 2019-08-20 20:47:37 · 3279 阅读 · 5 评论 -
-bash: /usr/local/miniconda2/bin/conda: /home/hadoop/miniconda2/bin/python: bad interpreter: No such
今天发现测试环境某个NodeManager的状态不良,看错误信息为磁盘满,于是打算清理相关没用的文件在/usr发现占用最大的是miniconda2的目录,这个目录之前是从/home目录迁移过去的,于是打算删除一些没用的conda安装包执行命令:/usr/local/miniconda2/bin/conda clean -y -t发现报错-bash: /usr/local/m...原创 2019-10-08 17:03:23 · 487 阅读 · 0 评论 -
SpringBoot不同模块间类引用无法获取json对象参数中的字段值
今天在测试调整项目结构代码后,对数据的发送接收做测试,发现数据能接收到,但是接收到的字段全都是空的排查过程1.1、追踪数据源头 通过远程调试确认数据是正常发送,每个字段都是有值的 1.2、确认数据接收实体对象是否有问题 一开始以为是并发导致的,因为其他地方也有用到该实体,但是调试过程中发现堆栈信息根本不是其他线程上下文, 重新还原原...原创 2019-04-26 18:30:20 · 425 阅读 · 0 评论