大数据数仓
BigData-0
这个作者很懒,什么都没留下…
展开
-
hive升级HiveException java. lang. RuntimeException
【代码】hive升级HiveException java. lang. RuntimeException。原创 2022-11-06 10:05:25 · 216 阅读 · 0 评论 -
yarn没有这三个指标allocatedMB,allocatedVcores和runningContainers
yarn原创 2022-11-05 16:29:35 · 411 阅读 · 0 评论 -
hadoop2.x升级到3.x注意事项
hdfs 50070无法访问,原因是未配置hdfs-site.xml<property> <name>dfs.namenode.http-address</name> <value>hadoop102:50070</value></property>其他节点未启动 NameNode NodeManager,在/home/baiyun/my_soft/hadoop-3.2.1/etc/hadoop/work原创 2022-11-05 16:27:15 · 400 阅读 · 0 评论 -
There are 1 missing blocks. The following files may be corrupted:
hadoop原创 2022-11-05 14:08:44 · 924 阅读 · 0 评论 -
虚拟机flink webui无法访问
192.168.138.102 hadoop102192.168.138.103 hadoop103192.168.138.104 hadoop104原创 2022-11-05 11:28:43 · 2093 阅读 · 0 评论 -
Please make sure to export the HADOOP_CLASSPATH environment variable or have hadoop in your classpat
【代码】Please make sure to export the HADOOP_CLASSPATH environment variable or have hadoop in your classpat。原创 2022-11-05 11:18:59 · 945 阅读 · 0 评论 -
集群节点状态监控和flink作业监控
grafana监控原创 2022-11-05 10:45:41 · 1048 阅读 · 0 评论 -
supervisor离线安装
supervisor离线安装。原创 2022-11-05 10:26:04 · 411 阅读 · 0 评论 -
flink on yarn提交样例,控制1个taskmanger 拥有的slot和cpu个数参数配置
flink on yarn提交样例,控制1个taskmanger 拥有的slot和cpu个数参数配置原创 2022-11-04 23:28:39 · 1039 阅读 · 0 评论 -
python保存网页截图
【代码】python保存网页截图。原创 2022-11-04 23:19:25 · 431 阅读 · 0 评论 -
python钉钉机器人发图片
python钉钉机器人发图片原创 2022-11-04 23:09:52 · 2331 阅读 · 0 评论 -
linux 指定git版本安装,maven安装
git指定版本安装原创 2022-09-18 12:47:17 · 453 阅读 · 0 评论 -
flink_cdc包提交流程
在idea中使用package命令带包,不带依赖flink_cdc-1.0-SNAPSHOT.jar1.添加第三方包到lib目录下,所有从节点也需要mv test/flink-connector-mysql-cdc-1.1.1.jar /opt/module/flink/lib/xsync /opt/module/flink/lib/flink-connector-mysql-cdc-1.1.1.jar2.启动集群start-cluster.shlocalhost:8081 webui3.原创 2021-09-20 22:41:23 · 486 阅读 · 0 评论 -
亚马逊aws emr hadoop集群 调度工具azkaban安装
解压后重命名keytool -keystore keystore -alias jetty -genkey -keyalg RSA在 azkaban目录下生成keystore文件,然后mv到/lib/azkaban/azkaban-web/lib/azkaban/azkaban-web/conf/azkaban.properties#Azkaban Personalization Settingsazkaban.name=Testazkaban.label=My Local Az.原创 2021-06-27 19:45:15 · 387 阅读 · 3 评论 -
azkaban配置邮箱
mail.sender=xxx@163.commail.host=smtp.163.commail.user=xxx@163.commail.password=邮箱授权码job.failure.email=xxx@163.comjob.success.email=xxx@163.com原创 2021-06-26 22:49:17 · 820 阅读 · 0 评论 -
flink-standalone提交作业
flink-standalone 安装配置好后启动flink集群/opt/module/flink/bin/start-cluster.shhttp://192.168.9.101:8081/#/task-manager编写样例import org.apache.flink.api.scala.ExecutionEnvironmentimport org.apache.flink.streaming.api.scala._object FlinkTest { def ma原创 2021-06-12 20:08:26 · 817 阅读 · 0 评论 -
用sqoop从hdfs export mysql字段个数、分隔符必须对应Error during export: Export job failed!--- java.util.NoSuchElem
sqoop export \--connect jdbc:mysql://hd101:3306/company \--username root \--password 123456 \--table staff2 \--num-mappers 1 \--export-dir /company \--input-fields-terminated-by "\t"原创 2021-06-06 21:06:03 · 249 阅读 · 0 评论 -
yarn中要看详细的job日志
1.JobHistoryServer得启动2.修改windows的hosts文件 C:\Windows\System32\drivers\etc\hosts,因为在服务器上可能配置的ip的别名,到Windows浏览器不识别3.vim /opt/module/hadoop/etc/hadoop/mapred-site.xml 中添加以下日志参数...原创 2021-06-06 19:32:16 · 256 阅读 · 0 评论 -
java华为od机试书生编号1-n,先按照身高优先排序,身高相等时按照体重排序,输出排序后的编号 需要用到双重比较
import javax.swing.*;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.util.ArrayList;import java.util.Arrays;import java.util.Comparator;import java.util.TreeSet;public class Main9 { public原创 2021-05-29 22:17:02 · 1674 阅读 · 0 评论 -
java华为od机试 寻找字母开头或者结尾,其他字符为数字的字符串最大长度
import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.util.ArrayList;import java.util.Collections;// afv1234ad 4public class Main10 { public static void main(String[] args) throws IOException { .原创 2021-05-29 22:11:52 · 311 阅读 · 0 评论 -
xshell无法连接虚拟机
查看vmnet8无法访问打开window的 VMware NET Service原创 2021-05-29 18:13:58 · 67 阅读 · 0 评论 -
无法访问/opt/module/spark/jars/spa
[baiyun@hd102 bin]$ hivels: 无法访问/opt/module/spark/jars/spark-*.jar: 没有那个文件或目录解决hive启动报错提示 修改/opt/module/hive/bin/hiveif [[ -n “$SPARK_HOME” ]]thensparkAssemblyPath=ls ${SPARK_HOME}/lib/spark-assembly-*.jarCLASSPATH="CLASSPATH:{CLASSPATH}:CLASSPATH:{s原创 2021-05-26 23:09:09 · 281 阅读 · 0 评论 -
zookeeper安装后报错 没有到主机的路由
zookeeper安装后报错查询zookeeper.out日志java.net.NoRouteToHostException: 没有到主机的路由 (Host unreachable)查看防火墙xcall sudo service iptables status发现有个机器未关闭关闭防火墙sudo service iptables stop重新启动zookeeper集群xcall zkServer.sh status -> OK...原创 2021-05-25 23:56:29 · 799 阅读 · 0 评论 -
hive第三方客户端dbeaver
opt/module/hive/bin/hiveserver2需要将以下两个包提前放进去,不然下载很慢同时需要开启原创 2021-05-23 17:50:21 · 128 阅读 · 0 评论 -
配置hive元数据到mysql后启动不了 java.sql.SQLException: Access denied for user ‘root‘@‘hd101‘ (using password:
只能保留 host=%的,其他都需要删掉Caused by: java.sql.SQLException: Access denied for user 'root'@'hd101' (using password: YES) at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1078) at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:4237) at co转载 2021-05-23 17:36:27 · 907 阅读 · 0 评论 -
java.io.IOException: Got error, status message , ack with firstBadLink as 192.168.9.102:50010 at or
hdfs上传文件只有部分节点有副本部分节点防火墙关闭,部分未关闭原创 2021-05-23 16:29:14 · 532 阅读 · 0 评论 -
hadoop:50070和yarn8088 web网页打不开
hadoop:50070和yarn8088 web网页打不开检查namenode和resourcemanager机器的防火墙sudo service iptables status-若运行中,则需要关闭sudo service iptables stop原创 2021-05-23 16:19:38 · 1065 阅读 · 0 评论 -
即席查询presto webui
[baiyun@hadoop103 yanagishima-18.0]$ nohub bin/yanagishima-start.sh >y.log 2>&1 &jetty.port=7080presto.datasources=baiyun-prestopresto.coordinator.server.baiyun-presto=http://hadoop103:8881catalog.atiguigu-presto=hiveschema.atiguigu-pres原创 2020-12-07 22:43:09 · 462 阅读 · 0 评论 -
pyhive创建表
from pyhive import hiveconn = hive.Connection(host='hadoop104',port=10000,username='baiyun' ,database='gmall')cursor = conn.cursor()cursor.execute('show tables')cursor.execute('show tables')cursor.execute('create table create_by_pyhive as select 1')..原创 2020-12-06 00:19:59 · 940 阅读 · 0 评论 -
python与hive集成时pip install sasl的时候可能会报错
使用 pip install sasl-0.2.1-cp36-cp36m-win_amd64.whl 离线安装https://www.lfd.uci.edu/~gohlke/pythonlibs/#saslLooking in indexes: https://pypi.tuna.tsinghua.edu.cn/simpleCollecting saslUsing cached https://pypi.tuna.tsinghua.edu.cn/packages/8e/2c/45dae93d666a原创 2020-12-05 23:25:41 · 1781 阅读 · 0 评论 -
HiveServer2用户名密码验证
用户名为linux的用户名称,密码不需要原创 2020-12-05 23:04:47 · 969 阅读 · 0 评论 -
hive cast(‘‘ as decimail(10,8))强转空字符串输出null
hive cast('' as decimail(10,8))强转空字符串输出null原创 2020-11-21 10:29:31 · 923 阅读 · 0 评论 -
hive判断一个code对应两个名称sql写法
with a as (select code,name from tb_name group by code,name),b as (select code ,count(*) cn from a)select * from b where cn >1;原创 2020-11-19 22:14:10 · 167 阅读 · 0 评论 -
hive使用正则将非数字字母开头的字段转null
if(flag rlike '\^[0-9a-zA-Z]',flag ,null)原创 2020-11-19 22:03:53 · 1575 阅读 · 0 评论