大数据采集与预处理
文章平均质量分 66
智能边缘探索记
我们团队致力于探索联邦学习前沿,我们的智能行为检测系统通过Kubernetes、KubeEdge、EdgeMesh和Sedna的融合,克服分布式部署挑战,实现边缘计算优势。本系列博客旨在分享集群搭建心得,解决方案,帮助你洞察联邦学习的实践应用。
展开
-
ETL工具Kettle
1 Kettle的基本概念一个数据抽取过程,主要包括创建一个作业(Job),每个作业由一个或多个作业项(Job Entry)和连接作业项的作业跳(Job Hop)组成。每个作业项可以是一个转换(Transformation)或是另一个作业。一个转换由一个或多个步骤(Step)和连接步骤的跳(Hop)组成。原创 2023-10-28 22:31:44 · 748 阅读 · 0 评论 -
Flume基本使用--mysql数据输出
了解并熟悉flume的功能掌握flume的使用方法,学会按要求编写相关配置文件原创 2023-10-24 08:26:40 · 2100 阅读 · 0 评论 -
Kafka与MySQL的组合使用
Kafka与MySQL的组合使用ta原创 2023-10-19 20:25:04 · 2022 阅读 · 4 评论 -
采集网页数据保存到文本文件---爬取古诗文网站
网络爬虫原创 2023-10-08 13:20:34 · 2562 阅读 · 1 评论 -
使用Python操作MySQL数据库
使用Python操作MySQL数据库原创 2023-09-06 08:04:53 · 255 阅读 · 0 评论 -
Hadoop的安装和使用,Windows使用shell命令简单操作HDFS
Hadoop的安装和使用,Windows使用shell命令简单操作HDFS,Hadoop是一个能够对大量数据进行分布式处理的软件框架,并且是以一种可靠、高效、可伸缩的方式进行处理的,它具有以下几个方面的特性。 高可靠性。 高效性。 高可扩展性。 高容错性。 成本低。 运行在Linux平台上。 支持多种编程语言。,2,分布式文件系统HDFS原创 2023-09-11 22:29:30 · 2999 阅读 · 1 评论