线上问诊
文章平均质量分 94
尚硅谷大数据项目:线上问诊数仓项目
超哥--
遨游在0/1海洋中的苦逼大学生
展开
-
线上问诊:可视化展示
这次博客我们就可以完成线上问诊的离线数仓项目。至此线上问诊离线数仓项目完成。可以考虑抓个快照。原创 2023-09-08 00:26:24 · 252 阅读 · 0 评论 -
线上问诊:数仓开发(三)
这次我们继续进行数仓的开发,应该能写完。数仓开发到这里就结束了。原创 2023-09-04 23:49:42 · 365 阅读 · 0 评论 -
线上问诊:数仓开发(二)
我们这次博客继续完成数仓的开发内容有点多,可能还要一次才能完成。原创 2023-09-03 00:45:24 · 299 阅读 · 0 评论 -
线上问诊:数仓开发(一)
上次我们已经将MYSQL的数据传送到了HDFS,但是HDFS的数据没法直接进行查看和修改。这次我们将其转入hive仓库,并进行下一步的处理。数仓开发的代码太多了,还是分两次记录吧。原创 2023-09-01 00:52:58 · 644 阅读 · 0 评论 -
Hive3第六章:更换引擎
这个博客主要是作为数仓项目的一次补充,主要是更换hive引擎,传统的MR引擎在hive2之后就不推荐了,我们这次更换spark引擎,使用hive on yarn。hive更换引擎是数仓学习中很通用的,所以这里单拎出来简单说一下。原创 2023-08-29 23:51:32 · 582 阅读 · 0 评论 -
线上问诊:数仓数据同步
上次博客记录的是数据的采集,这次我们记录一下数据从MYSQL到HDFS的数据同步。数据的同步到这里就结束了。原创 2023-08-27 23:20:35 · 1238 阅读 · 1 评论 -
线上问诊:业务数据采集
暑假躺了两个月,也没咋写博客,准备在开学前再做个项目找找感觉,由于之前做过广告数仓的案例,这次的博客会相对简略一些,数仓包括离线和实时两个部分,离线用来加深记忆,实时用来学习新技术。这里抓一次快照,后边实时数仓还要基于这里再次开发。原创 2023-08-23 16:11:32 · 1372 阅读 · 5 评论