NN元数据工作机制

HDFS的实现思路:

1.HDFS通过分布式集群来存储文件,为客户端提供便捷的访问方式
2.文件存储到HDFS集群去的时候,被切分为block
3.HDFS存放在若干datanode节点 上
4.HDFS文件系统与真实的block之间有映射关系,由于NameNode管理
5.每个block在集群中会存储多个副本,好处:提高数据的可靠性,吞吐量

HDFS架构:

NameNode
DataNode
SecondaryNameNode
在这里插入图片描述

问题:

1)若将元数据存在文件里面,那么就属于文件的随机访问,要查询一条元数据,得定位到哪一行,速度很慢,
2)若放到内存里面,万一宕机了怎么办?断电了呢?那么元数据就丢失了。
3)定期flush到磁盘文件,可是内存很大,很容易丢失

解决:

1.在这里插入图片描述

2.NN + SN

在这里插入图片描述

NN+SN: (非HA机制)

可以保证数据的可靠性,却不能保证可用性,即当NN宕机的时候,那么集群就不可用了,
那么Client就无法访问了,而且很多基于此集群的应用也就停止工作了。

元数据可恢复但是集群没法对外服务,这个怎么解决?

1)找两个集群吗?那也会存在问题?

  • 速度

  • 数据同步

  • 成本高

2)两个NN吗?
一个主一个备,可是它们之间怎么同步数据呢?当两个NN同时存在的时候,可能两个都 往里面写数据,那么如何保证数据的一致性呢?

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: NN(Nearest Neighbor)是一种分类和回归算法,其工作原理是在训练数据集找到与当前输入最为相似的数据点,并将其分类到与该数据点相同的类别。 2NN是一种对NN算法的改进,它首先像NN一样找到最近的一个数据点,然后再找到离当前输入最近的另外一个数据点,最后将这两个数据点的类别进行比较,将当前输入分类到占多数的那个类别。 ### 回答2: nn是神经网络的缩写,指的是一种模仿人类神经系统的计算模型。它由神经元组成,每个神经元都有输入和输出。简单来说,nn工作原理可以归纳为以下几个步骤: 1. 输入层:接收来自外界的输入信号,将其传递给下一层进行处理。 2. 隐藏层:通过线性加权和非线性激活函数的处理,将输入信号进行转换和特征提取。隐藏层可以有多个,每个隐藏层的神经元数量和层数决定了神经网络的深度和复杂度。 3. 输出层:将最后一个隐藏层的结果转化为最终的输出结果。输出层的神经元数量通常与输出的维度相对应。 4. 反向传播:通过比较网络输出和实际结果之间的误差,使用梯度下降算法来不断调整权重和偏置。反向传播的目的是最小化误差,并提高神经网络的准确性。 2nnnn的一个变种,它包含两个独立的神经网络。两个神经网络的结构和工作原理与nn基本相同,只是在训练过程采用不同的数据集进行训练。两个神经网络的输出结果会被合并,从而得到更准确的最终输出结果。 总结来说,nn和2nn工作原理都是基于神经元之间的连接与传递信息的方式,通过调整权重和偏置来不断学习并提高准确性。两者的不同在于2nn使用了两个独立的神经网络,通过结果的合并来增强预测精度。 ### 回答3: nn和2nn都是人工神经网络的模型,用于解决机器学习和人工智能的各种问题。它们的工作原理可以简单描述如下: 1. nn(神经网络)的工作原理: nn是一种由神经元(或节点)组成的网络结构,每个神经元都接收来自其它神经元的输入,并通过激活函数进行计算并产生输出。这种结构通常分为输入层、隐藏层和输出层。输入层接收外部数据,隐藏层对数据进行处理和转换,输出层提供最终结果。 在训练过程,使用反向传播算法来调整神经元之间的连接权重,以最小化预测结果和实际值之间的误差。通过多次迭代训练,神经网络可以逐渐提高其预测准确性,并学习到输入数据的隐藏规律和特征,从而能够对未知数据进行预测和分类。 2. 2nn(双向神经网络)的工作原理: 2nn是一种特殊的神经网络结构,它不仅可以实现前向传播(从输入层到输出层),还可以实现反向传播(从输出层到输入层)。这种双向传播方式使得2nn相对于nn在处理某些问题时更加有效。 为了实现双向传播,2nn需要增加一个反向层(反向隐藏层),该层的输入是输出层的输出,并将其传递回到输入层。通过这种机制,反向隐藏层可以根据输出层的结果,向前传播调整网络权重和连接,以更好地反应输入层到隐藏层的模式。 在训练过程,2nn通过迭代训练,同时优化前向传播和反向传播的结果。通过这种双向传播的机制,2nn能够更准确地学习到输入数据的特征和隐藏规律,提高其预测和分类能力。 综上所述,nn和2nn都是通过神经元之间的连接和激活函数来处理输入数据,并通过反向传播算法调整连接权重的人工神经网络模型。通过不断迭代训练,它们可以学习输入数据的特征和规律,并能够对未知数据进行预测和分类。而2nn相对于nn在处理某些问题时更加有效,通过双向传播机制可以更准确地学习和调整网络权重。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值