- 博客(3)
- 收藏
- 关注
原创 spark-excel依赖的问题
最近需要使用Spark SQL清洗Excel的数据,在网上找到了spark-excel <dependency> <groupId>com.crealytics</groupId> <artifactId>spark-excel_2.12</artifactId> <version>0.13.7</version> <
2022-04-06 22:25:30 1319 1
原创 【维度建模中的事实表】
维度建模中的事实表与维度表事实表概念什么是事实表什么是维度事实表概念什么是事实表“事实”这一术语表示某个业务度量。所谓的度量即业务过程中产生的一些可加的(订单金额、销售数量等)或者非可加(商品价格、温度等)的数值,事实表就是通过获取描述业务过程的度量来表达业务过程。事实表的每行数据是一个特定级别的细节数据,被称为粒度。例如粒度为单个商品的商品销售事实表中,一行数据表示卖出的单个商品。粒度为订单级别的商品销售事实表中,一行数据表示的一个订单细节的数据。是需要注意的是,在同一个事实表中粒度是统一的,
2022-03-30 21:54:28 332
原创 Hive堆内存溢出
报错:running beyondphysical memory limits.Current usage: 1.3 GB of 1.7 GBphysical memory used; 7.4 GB of 13.2 TB virtual memory used. Killing container。解决方案# 为MapReduce增大堆内存set mpareduce.map.java.opts=-Xmx3072 -XX:++UseConcMarkSweepGC;set mapreduce.map
2021-08-09 10:32:50 645
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人