hadoop(1) —— hdfs分布式文件系统

文章原文:

参考文献:

返回知识列表:


 

>>HDFS缺点:

- 低延迟数据访问

  • 比如毫秒级
  • 低延迟与高吞吐率

-小文件存储

  • 占用NameNode大量内存。因为元数据跟文件信息相关,文件越多,则元数据越多。造成NameNode越大。元数据都是加载到内存工作的。
  • 寻道时间超过读取时间

- 并发写入、文件随机修改

  • 一个文件只能有一个写者。类似网盘,网盘的内容都是不允许修改的。
  • 仅支持append

 

>>HDFS数据存储单元(block)

- 文件被切分成固定大小的数据块

  • 默认数据块大小为64MB,可配置
  • 若文件大小不到64MB,则单独存成一个block

- 一个文件存储方式

  • 按大小被切分成若干个block,存储到不同节点上
  • 默认情况下每个block都有三个副本

- Block大小和副本数通过client端上传文件时设置,文件上传成功后副本数可以变更,Block Size不可以变更


>>NameNode(NN)

    - NameNode主要功能: 接受客户端的读写服务

    - NameNode保存metadate 信息包括

          --文件ownership和permissions

          --文件包含哪些块

          --Block保存在哪个DataNode(由DataNode启动时上报)

    - NameNode的metadate信息在启动后会加载到内存

           --metadata存储到磁盘文件名为“fsimage”

           --Block的位置信息不会保存到fsimage

           --edits记录对metadata的操作日志。类似于关系型数据库的事务。


>>SecondaryNameNode(SNN)

    -- 它不是NN的备份(但可以做备份,所以别放到一个机器上,否则一坏都坏了),它的主要工作是帮助NN合并edits log,减少NN启动时间

    -- SNN执行合并时机

            - 根据配置文件设置的时间间隔 fs.checkpoint.period 默认3600秒

            - 根据配置文件设置edits log大小 fs.checkpoint.size 规定edits文件的最大默认值是64MB


>>DataNode(DN)

    -- 存储数据(Block)

    -- 启动DN线程的时候会向NN汇报block信息

    -- 通过向NN发送心跳保持与其联系(3秒一次),如果NN 10分钟没有收到DN的心跳,则认为其已经lost,并copy其上的block到其他DN。

 

>>Block的副本放置策略

    -- 第一个副本:放置在上传文件的DN;如果是集群外提交,则随机挑选一台磁盘不太满

 

 

 

【HW3000的收发程序】是一个与硬件设备HW3000相关的软件实现,主要用于处理数据的发送和接收。在这个项目中,我们关注的是一个基于STM8S105微控制器的示例代码,它使用了IAR集开发环境。这个压缩包包含了名为"A版本"的代码示例,这表明可能还有其他版本在,例如"B版本"或"C版本",每个版本可能对应不同的功能改进或优化。 STM8S105是意法半导体(STMicroelectronics)推出的一款8位微控制器,属于STM8系列。该芯片具有高性能、低功耗的特点,常用于各种嵌入式系统,如工业控制、消费电子和汽车电子等领域。IAR是一个流行的嵌入式系统开发工具,提供了一整套集开发环境(IDE),包括编译器、调试器和其他辅助工具,使得开发者能够方便地编写、编译和调试STM8S105上的代码。 在HW3000的收发程序中,我们预计会看到以下关键知识点: 1. **硬件接口**:为了与HW3000通信,代码可能定义了特定的GPIO引脚来控制数据传输和握手信号。这些引脚可能是通过STM8S105的端口和引脚配置来实现的。 2. **通信协议**:HW3000可能使用某种串行通信协议,如SPI、I2C或UART。代码会包含相应的初始化函数和数据传输函数,以遵循该协议。 3. **中断服务例程**:为了实时响应数据收发事件,程序可能使用中断服务例程(ISR)。当硬件检测到新的数据或发送完时,中断将被触发,并执行相应处理。 4. **数据缓冲区管理**:在发送和接收数据时,可能需要使用缓冲区来储待发送的数据或接收的数据包。代码会包含关于如何填充、读取和清空缓冲区的逻辑。 5. **错误检测和处理**:良好的通信程序会包含错误检测机制,如CRC校验或奇偶校验,以及错误处理代码,以确保数据的完整性和正确性。 6. **同步机制**:为了确保发送和接收的顺序,可能使用了互斥锁、信号量或其他同步原语来避免数据冲突。 7. **代码注释**:描述中提到代码注释详细且通俗易懂,这意味着开发者可以很容易地理解每一部分的功能,这对于理解和维护代码至关重要。 由于这是一个"A版本"的代码,我们可以假设它可能是项目的基础版本,可能随着项目的进展,后续的版本会包含更高级的功能、优化的性能或者修复的已知问题。对这个压缩包的深入研究将有助于我们了解HW3000硬件的工作原理,以及如何有效地与之进行软件交互。
【源码免费下载链接】:https://renmaiwang.cn/s/fmfod 在 Cisco 交换机上管理 VLAN 是网络管理员日常工作中不可或缺的一部分。VLAN(虚拟局域网)的创建和删除有助于组织网络流量、提高安全性并优化网络性能。然而,在某些情况下,需要删除不再使用的 VLAN,以避免资源浪费和潜在的配置冲突。在 Cisco 交换机中,简单地执行`no vlan`命令并不能彻底删除一个 VLAN,因为这只会从 VLAN 数据库中移除 VLAN 的定义,而不会处理相关的接口配置。以下是一步一步的详细步骤,确保完全删除一个 VLAN:1. **连接到交换机**:可以通过控制台口或使用 Telnet 远程连接至交换机。一旦建立连接,将进入用户模式(User EXEC Mode),提示符显示为`<Switch>`。2. **切换到特权模式**:在用户模式下输入`en`命令,切换到特权模式(Privileged EXEC Mode),提示符变为`Switch#`。3. **进入全局配置模式**:在特权模式下,输入`conf t`命令,进入全局配置模式,此时提示符变为`Switch(config)#`。4. **移除接口上的 VLAN 配置**:如果 VLAN 已分配给接口,则必须先从接口上移除 VLAN 配置。例如,在删除 VLAN 20 时,可以输入`int f0/1`进入接口配置模式,然后执行命令`no switchport access vlan 20`。如果 VLAN 20 被多个接口使用,则需要对每个接口重复此操作。5. **移除 VLAN 接口**:接下来,删除 VLAN 接口,输入`no interface vlan 20`。这将解除 VLAN 20 对其所有相关接口的配置。6. **彻底删除 VLAN**:最后,执行命令`no vlan 20`,从 VLA
【源码免费下载链接】:https://renmaiwang.cn/s/5drve 二分图完美匹配属于图论中的一个重要概念,在该领域中具有特殊意义。特别是在研究匹配理论时,这一概念往往为核心内容之一。将节点集合划分为两个互不相交的部分,其中每一部分内部的节点之间不会直接相连。完美匹配指的是在这样一个结构下,通过特定方式使得每个节点都能与另一组中的唯一一个节点建立连接,并且没有任何剩余的未配对节点在。匈牙利算法作为一种高效的计算方法,在解决二分图最大匹配问题时发挥着关键作用。该算法的基本思路在于逐步构建增广路径来扩大已有的匹配规模,最终达到最大匹配目标。具体而言,一条增广路径是一条连接两个未被配对节点的路径,在其中交替出现已配对与未配对的状态。每次找到这样的一条路径后,通过调整相关边的方向和位置,可以实现匹配数量的增加。在提供的代码实现中,匈牙利算法主要分为以下几个部分:初始化阶段、增广路径搜索函数、主处理函数以及最终输出结果的部分。初始化阶段主要是定义必要的变量参数;增广路径搜索函数用于寻找能够提升当前匹配程度的路径;主处理函数则通过调用上述辅助函数,系统地完整个匹配过程,并输出最终的匹配数量信息。该算法在多个实际应用场景中展现出强大的实用性,例如解决任务分配、婚姻配对以及网络路由等问题时都发挥着不可替代的作用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ricardo于

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值