自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 硬刚Hive | 4万字基础调优面试小总结

数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反应历史变化(Time Variant)的数据集合,用于支持管理决策。数据仓库体系结构通常含四个层次:数据源、数据存储和管理、数据服务、数据应用。数据源:是数据仓库的数据来源,含外部数据、现有业务系统和文档资料等;

2023-07-20 11:51:34 348 1

原创 superset过滤器中,日期下拉框自动化转成时间戳问题

修改superset\utils\core.py 里面的json_int_dttm_ser函数,注释掉obj = (obj - EPOCH.date()).total_seconds() * 1000,更改为 obj = obj.strftime("%Y/%m/%d")

2023-06-15 13:12:36 806 1

原创 Hive 动态分区以及分区以及中文分区字段

hive 提供了一个动态分区功能,其可以基于查询参数的位置去推断分区的名称,从而建立分区。

2023-06-06 16:24:28 3517 1

原创 HADOOP多个DFS目录中有一个磁盘空间超过90%解决(USED SPACE ABOVE THRESHOLD OF 90.0%)

根据我生成文件,所以我执行的命令是: hdfs diskbalancer -execute /system/diskbalancer/2020-十月-19-18-07-40/node3.plan.json。根据第一步生成的json文件,我生成的json名称为:/system/diskbalancer/2020-十月-19-18-07-40/node3.plan.json。我平衡的是node3,所以我的命令是:hdfs diskbalancer -query node3。PLAN_DONE 表示完成。

2023-05-29 09:55:57 652 1

原创 CentOS7解决yum命令doesn‘t have enough cached

第四步:如果第三步仍然报错,那就进入 /etc/yum.repos.d ,编辑vi CentOS-Base.repo,修改下面黄色标识的部分(只需要注释掉第一行,取消注释第二行),要修改4处。第六步:当然,报错的方法有很多,如果上述方法不能解决问题,建议在搜索一下其他解决方案;第二步:vi /etc/resolv.conf,添加下面一行:nameserver 114.114.114.114。第五步:再次执行 yum update就可以执行 yum 命令了。第三步:修改完后执行一下yum update命令。

2023-05-15 11:04:52 381

原创 superset连接hive整个过程(详细)以及过程中的各种报错解决方法比如错误User: tom is not allowed to impersonate tom等等

测试连接hive的时候,一直报错,不能获取192.168.10.104下面的数据,所以我们此时应该重启superset或者关掉superset、关闭hadoop集群,再开启hadoop、superset、登录superset即可。测试连接成功,之后在superset上面可视化的时候,执行mapreduce任务的时候,因为内存不够,从而kill掉了mapreduce进程。对于这个问题一般情况下,只修改core-site.xml就可以解决问题,解决拒绝连接的问题。(1)修改hive-site.xml。

2023-04-10 18:36:19 1619 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除