- 博客(7)
- 收藏
- 关注
原创 大数据技术之Hive SQL练习(中级)
实验数据准备注意实验时可能会出现Hive 查询视图时遇到中文乱码???问题解决方法进入mysql,输入以下两条命令:ALTER TABLE `TBLS` MODIFY COLUMN VIEW_EXPANDED_TEXT mediumtext CHARACTER SET utf8;ALTER TABLE `TBLS` MODIFY COLUMN VIEW_ORIGINAL_TEXT mediumtext CHARACTER SET utf8;创建表并加载数据--1.用户信息表DRO
2024-05-16 08:05:51 1230
原创 Flink读取kafka主题,并写入hbase
是版本号错误 flink-sql-connector-hbase-2.2-1.17.2.jar 1.17.2与flink版本号不对。hbase(main):014:0> create 'venn','cf' 创建表,有一个列族cf。(4)对于一大题,可拆成若干步,如上面可拆成连接kafka,连接hbase,插入三步,缩小问题范围。本次解决问题是用了flink-sql-connector-hbase-2.2-1.17.2.jar。{"字段1": "值1", "字段2":"值2", ……
2024-03-13 22:45:02 2168 1
原创 统计影音视频网站的常规指标,各种TopN指标
本文通过实例项目,详细讨论了数据清洗过程、清洗后数据以hive表形式存放在hdfs中、以及如何应用数据。
2024-02-13 22:04:44 1137 1
原创 离线数据处理 任务二:数据清洗
若该数据在进入dwd层时发生了合并修改,则dwd_insert_time时间不变,dwd_modify_time存当前操作时间,其余列存最新的值。//(4)将ods.customer_inf 与dwd.customer_inf表数据合并并去重,数据存入表dwd.customer1_inf。19991 曾凤兰 20221230。19998 赵丹丹 20221230。19991 曾凤兰 20221230。19998 赵丹丹 20221230。
2023-12-31 21:35:32 2510 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人