大数据
文章平均质量分 71
大数据
肥猪猪爸
希望我的存在,能为这世界留下微薄的贡献
展开
-
pandas中groupby和shift结合实现相邻行的计算
pandas中groupby和shift结合实现相邻行的计算原创 2024-05-20 17:44:57 · 132 阅读 · 0 评论 -
看看airflow怎样调度python写的spark任务吧
看看airflow怎样调度python写的spark任务吧原创 2024-05-10 17:41:15 · 402 阅读 · 2 评论 -
文件读取的高效方法与设计模式
文件读取的高效方法与设计模式原创 2024-03-18 17:49:05 · 1081 阅读 · 0 评论 -
Could not establish connection to “xx.xx.xx.xx“:The VS Code Server faild to start.【重要解决方案】
vscode无法远程开发的解决原创 2024-02-04 18:15:26 · 523 阅读 · 0 评论 -
Netty传输object并解决粘包拆包问题
Netty传输object并解决粘包拆包问题原创 2023-11-17 18:53:56 · 299 阅读 · 3 评论 -
Netty中粘包拆包问题解决探讨
介绍了Netty中粘包拆包问题,并通过代码案例,探讨对粘包拆包问题的解决原创 2023-11-17 17:50:41 · 382 阅读 · 3 评论 -
sqoop笔记——一次从Hive到PostgreSql的数据迁移
记录一次从Hive到PostgreSql的数据迁移任务原创 2023-07-07 15:42:56 · 1015 阅读 · 0 评论 -
MapReduce编程模型——自定义序列化类实现多指标统计
本文介绍了序列化的概念,强调了Hadoop序列化的优点,并通过一个案例来演示MapReduce中自定义序列化类实现多指标统计。原创 2022-11-15 14:33:53 · 790 阅读 · 3 评论 -
MapReduce编程模型——在idea里面邂逅CDH MapReduce
本文在IDEA中编写基于CDH的MapReduce任务并操作CDH平台HDFS中的文件,实操可运行原创 2022-11-14 16:13:33 · 1232 阅读 · 5 评论 -
spark3总结——分区数对带有初始值聚合操作的影响
spark3总结——分区数对带有初始值聚合操作的影响原创 2022-09-09 11:35:39 · 662 阅读 · 6 评论