自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 在FinalShell中使用Flume实现数据监听的实践教程

代码为flume-ng agent -n a1 --conf-file nc-flume.conf -Dflume.root.logger=INFO,console。(1).Agent:Flume Agent是数据采集的主要组件,负责监听指定的数据源,将数据传输到Channel中,并最终将数据写入到目标位置。(4).Sink:Sink是Flume Agent中用于将数据从Channel中发送到目标位置的组件,可以是文件、网络端口、数据库等。(2).数据聚合:将采集的数据聚合到指定的Channel中。

2023-10-15 14:48:23 126

原创 Hadoop的基础代码

(4).hdfs dfsadmin -refreshNodes:刷新节点列表,更新HDFS集群的节点信息。(3).hadoop fs -put <本地文件> <目标路径>:将本地文件复制到HDFS中的目标路径。(3).hdfs dfs -put <本地文件> <目标路径>:将本地文件复制到HDFS中的目标路径。(4).hadoop fs -get <源路径> <本地目录>:将HDFS中的文件复制到本地目录。(4).hdfs dfs -get <源路径> <本地目录>:将HDFS中的文件复制到本地目录。

2023-09-30 20:26:09 266

原创 大数据技术的相关基础知识

3.虚拟网络:VMware Workstation Pro提供了虚拟网络功能,可以创建不同类型的虚拟网络,如桥接网络、NAT网络和仅主机网络等,实现虚拟机与主机机器或其他虚拟机之间的通信。7.虚拟机调试与测试:VMware Workstation Pro提供了虚拟机调试和测试的功能,可以模拟不同的环境和场景,方便开发和测试人员进行软件开发和测试工作。6.数据存储与管理:介绍使用Hadoop生态系统进行数据存储和管理的技术和方法,包括使用HBase进行实时数据存储和查询、使用Sqoop进行数据导入和导出等。

2023-09-30 19:28:38 186

原创 Hadoop入门指南:大数据处理的利器

例如,Flume用于实时数据采集,Sqoop用于关系型数据库和Hadoop之间的数据传输,Pig用于数据处理和分析,等等。除了HDFS和MapReduce,Hadoop还包括其他重要组件,如YARN(资源调度和管理)、HBase(分布式数据库)、Hive(数据仓库)、Spark(内存计算框架)等。了解这些组件的功能和用法,能够更好地利用Hadoop进行大数据处理。Hadoop采用分布式架构,包括两个核心组件:Hadoop分布式文件系统(HDFS)和Hadoop分布式计算框架(MapReduce)。

2023-09-24 13:54:17 183

原创 Linux的免密

1.修改hosts文件并拷贝到其他虚拟机。1.通过ssh-keygen生成密钥。2.在其他虚拟机进行验证。2.拷贝密钥到其他虚拟机。

2023-09-17 18:14:25 73 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除