自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 尚硅谷尚品汇 vue 项目中配置多个代理服务器

【代码】尚硅谷尚品汇 vue 项目中配置多个代理服务器。

2024-02-29 11:43:42 359

原创 SpringCloud 教程 P59 错误问题

容器运行之后 order-service 一直保如上的错误,而 user-service 却可以正常访问,将 nacos 的连接信息单独抽取出来放到中提高优先级,重新打包并且放到主机上部署(最好先删除之前已经打包过的镜像)参考:https://blog.csdn.net/m0_56864757/article/details/124996361。

2023-12-19 10:40:05 2032

原创 HiveSQL 面试题 - 从订单表中查找符合指定购买条件的用户

从订单明细表(order_detail)中查询出所有购买过商品 1 和商品 2,但是没有购买过商品 3 的用户。order_info。

2023-07-21 17:49:14 247

原创 HiveSQL 面试题 - 查询每天最近三天的订单总额和平均订单额

查询截止每天的最近3天(不包含当天)的订单金额总和以及订单金额日平均值,保留两位小数,四舍五入。order_info。

2023-07-21 17:29:31 847 1

原创 HiveSQL 面试题 - 统计每天男性和女性用户的订单总金额

从订单信息表(order_info)和用户信息表(user_info)中,分别统计每天男性和女性用户的订单总金额,如果当天男性或者女性没有购物,则统计结果为 0。

2023-07-21 16:42:46 246

原创 记录一次 Hadoop Namenode 暂停时间过长故障

最近使用 HUE 的时,在浏览 hdfs 文件切换目录的时候,经常会出现卡住的现象,点进某个目录就一直转圈圈,并且 Yarn 上的任务跑的也很慢。出现这种情况怀疑是集群出现什么问题了,于是通过 CDH 管理界面查看,果然存在一个异常,描述信息是暂停持续时间,在前 5 分众内暂停所花的平均时间是每分钟 37.8秒(63.00%)。临界阈值:60%因为 Namenode 也是基于 JVM 实现的,这种情况一般都是(堆)内存不够,hdfs 使用过程中存储的文件越来越多,占用的内存也就越来越大。

2023-07-04 10:54:49 386

原创 新版本 Idea 创建 Web 项目的步骤

Idea 在更新了几个版本之后,创建项目的方式已经和之前有很大的区别,在此记录下新版本 Idea 创建简单 web 项目的步骤。注意打成 war,否则 tomcat 不会启动。

2023-06-26 15:52:01 251

原创 HiveSQL 面试题 - 向用户推荐朋友收藏的商品

现需要请向所有用户推荐其朋友收藏但是用户自己未收藏的商品,请从好友关系表(friendship_info)和收藏表(favor_info)中查询出应向哪位用户推荐哪些商品。

2023-06-21 17:56:11 339 1

原创 HiveSQL 面试题 -计算即时订单比例

订单配送中,如果期望配送日期和下单日期相同,称为即时订单,如果期望配送日期和下单日期不同,称为计划订单。请从配送信息表(delivery_info)中求出每个用户的首单(用户的第一个订单)中即时订单的比例,保留两位小数,以小数形式显示。

2023-06-21 17:00:44 82

原创 HiveSQL 面试题 - 查询指定日期的全部商品价格

查询所有商品(sku_info表)截至到2021年10月01号的最新商品价格(需要结合价格修改表进行分析)。

2023-06-20 18:11:42 221

原创 HiveSql 面试题 - 统计用户注册日期,总登录次数、订单数等指标

从用户登录明细表(user_login_detail)和订单信息表(order_info)中查询每个用户的注册日期(首次登录日期)、总登录次数以及其在2021年的登录次数、订单数和订单总额。

2023-06-20 17:49:04 289

原创 Spark 出现 NoSuchMethodError: com.google.common.base.Preconditions.checkArgument(ZLjava/lang/String;Lj

使用 Maven 分析工具,发现 guaua 依赖存在版本冲突,修改 maven 依赖排除指定的 gava 即可。修改后的 maven,将 spark-core 附带的 guava 依赖排除。

2023-06-06 16:53:21 624

原创 HiveSQL 面试题 - 查询累积销售件数高于其所属品类平均数的商品

从订单明细表(order_detail)中查询累积销售件数高于其所属品类平均数的商品。sku_info。

2023-05-28 18:45:23 139

原创 HiveSQL 面试题 - 统计每种商品销售件数最多的日期以及当日销量

从订单明细表(order_detail)中统计出每种商品销售件数最多的日期及当日销量,如果有同一商品多日销量并列的情况,取其中的最小日期。

2023-05-21 18:04:33 426

原创 Hadoop 存储占用分析命令,查看 Hdfs 文件夹占用大小

兼职公司 Hadoop 运维之后,经常要解决 Hdfs 空间占用的问题,不知道哪天谁又在集群上留下一大堆缓存文件也不清掉,Hadoop 本身默认就是三副本,人一多每个人留一点结果占用了一堆的存储空间。在 Hdfs 上也支持使用 du 进行文件大小的分析,但是套用上面的模式,就会有些不兼容,所以我对这个指令的结果进行一定的处理,可以得到和上面一样的效果,在此记录一下供大家参考,路线下的占用情况,而且这个脚本也可以兼容不同量级的存储大小,进行排序的时候,KB、MB、GB、TB 也是按顺序进行排列的。

2023-05-21 17:15:28 3492 1

原创 Hive 使用 create table as 语句出现 java.io.IOException: Filesystem closed 异常

最近在使用新搭建的 Hive 环境进行测试的时候出现了莫名的错误信息 java.io.IOException: Filesystem closed,最一开始搭建的时候,进行建表、数据查询等操作都没有这个问题,直到最近才发现这个问题,具体的报错信息如下。查看报错信息也没有找到具体的原因,只有文件 IO 异常。后来找到了原因,是 create table as select xxx 这种类型的 sql 导致 Hive 与 Hdfs 交互时文件未正常关闭,所以将问题以及解决方案在此记录一下。

2023-05-21 16:37:59 598 1

原创 Hive SQL 面试题 - 统计每日新增用户

从用户登录明细表(user_login_detail)中查询每天的新增用户数,若一个用户在某天登录了,且在这一天之前没登录过,则认为该用户为这一天的新增用户。

2023-05-13 18:00:00 532

原创 HiveSQL 面试题 - 统计每个商品销售首年的年份,首销年销售数量和销售总额

从订单明细表(order_detail)统计每个商品销售首年的年份,首销年销售数量和销售总额。

2023-05-13 14:24:07 234

原创 记录一次线上 Yarn 集群故障 - 集群资源 “缩水“ 问题

分享一下最近遇到的 Yarn 集群故障的问题,主要还是自己没有深入研究 Yarn 的相关参数导致的,分享给大家,避免出现一样的问题。51 假期回来发现集群上好多任务,Yarn 集群资源占用率到了 90%,并且很多任务都是 ACCEPT 状态根本分配不到资源来跑。到这就去检查集群上的任务,看看是不是有人乱申请资源提交任务,看了一圈也没发现有什么异常,去 CDH 上看了一下,发现 Hdfs 服务很多红色告警,都是提示磁盘空间不足(其实也在做数据冷备出库,但是一直没降下来),也没在意想着 Hdfs 有问题也不关

2023-05-13 13:07:44 300

原创 Windows 文件权限问题解决

自从使用了 WinToGo,有时候会访问原来的系统上的问题,第一次的时候会有权限提示,需要获取文件夹的访问权限,如果这个时候点了允许,那么就是将这个文件夹的属性完全打乱。现在登录到原来的系统,再去访问这个文件夹内的文件,可能就会出现各种问题(如下图):查看文件的属性信息发现和其他的文件完全不一样:正常的文件如下:这种情况就是使用其他的 windows 系统,访问了这个系统的文件,切回到原来的系统之后就会出现文件的属主和文件的权限问题。

2023-04-03 18:33:57 1232

原创 Log4j 配置详解以及使用案例

Log4j 的基本使用案例,以及相关配置信息详解,介绍了 Log4j 中的日志级别等等

2023-01-05 14:38:48 4784

原创 Hive SQL面试题-流失回流用户数统计

根据用户最后一次登录记录表,统计每天的流失(一段时间未登录平台)用户数量,和回流用户(一段时间未登录平台,但今天重新登录了平台)数量。执行环境:Hive on Spark

2022-11-21 15:40:03 2238 2

原创 SQL 经典面试题:统计最近七天连续三天活跃的用户

给定 mid,dt 的用户登录记录表,查找最近 7 天内连续 3 天活跃的用户 id,实现思路:获取最近 7 天的用户登录记录数据(在 where 中限定),对数据进行 rank 排序...

2022-10-10 15:12:26 4033

原创 Hive 动态分区异常

使用 Hive 的动态分区功能更新表数据时出现异常,如下:注意 return code 1 from org.apache.hadoop.hive.ql.exec.MoveTask. Exception when loading 20 in table,在插入数据时,mapreduce 任务没有异常

2022-09-28 18:06:01 1409

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除