自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Hadoop学习四 2.x介绍

1、Hadoop 1.x带来问题1、单点故障每个群集只有一个NameNode,NameNode存在单点故障(SPOF)。 如果该计算机或进程不可用,则整个群集在整个NameNode重新启动或在另一台计算机上启 动之前将不可用 如果发生意外事件(例如机器崩溃),则在操作员重新启动NameNode之前,群集将不可 用。 计划内的维护事件,例如NameNode计算机上的软件或硬件升级,将导致群集停机时间的延 长2、水平扩展 将来服务器启动的时候,启动速度慢3、namenode随着业务的增多,

2021-12-03 21:29:04 576

原创 Hadoop学习三 HDFS读数据

1、与NameNode通信查询元数据,找到文件块所在的DataNode服务器2、挑选一台DataNode(网络拓扑上的就近原则,如果都一样,则随机挑选一台DataNode)服务器,请求建立socket流3、DataNode开始发送数据(从磁盘里面读取数据放入流,以packet(一个packet为64kb)为单位来做校验)4、客户端以packet为单位接收,先在本地缓存,然后写入目标文件...

2021-12-03 15:54:23 873

原创 Hadoop学习二 HDFS写数据

1、宏观流程跟NameNode通信请求上传文件,NameNode检查目标文件是否已经存在,父目录是否已经存在 NameNode返回是否可以上传 Client先对文件进行切分,请求第一个block该传输到哪些DataNode服务器上 NameNode返回3个DataNode服务器DataNode 1,DataNode 2,DataNode 3 Client请求3台中的一台DataNode 1(网络拓扑上的就近原则,如果都一样,则随机挑选一台DataNode)上传数据(本质上是一个RPC调用.

2021-12-03 15:53:23 170

原创 Hadoop学习一 HDFS三兄弟(NN,DN,2NN)

1、NN负责部分NN负责对HDFS上的元数据进行管理,在NN中保存有最重要的三部分信息:1、文件由哪些块组成(filename->blocksequence (namespace))。2、每个块存在哪个位置)(block>machinelist(“nodes”))。3、除次之外还有文件名,上传者,上传时间等非关键信息。元数据在磁盘中存储在fsimage之中。2、2NN负责部分2NN负责将NN在运行期间产生的edits文件和fsimage文件合并,合并之后产生新的fsi.

2021-12-03 10:18:17 519

原创 Pycharm同目录下导入模块报错问题

同目录下导入模块会报No model named …错解决办法

2020-05-26 21:12:34 481

原创 筛法求素数

思路:给出要筛数值的范围n,找出n以内的素数p1,p2,p3,......,pk。先用2去筛,即把2留下,把2的倍数剔除掉;再用下一个素数,也就是3筛,把3留下,把3的倍数剔除掉;接下去用下一个素数5筛,把5留下,把5的倍数剔除掉;不断重复下去......。素数的个数为:n/ln(n)public class 求素数 { public static void main(String...

2019-03-23 20:18:26 173 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除