- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 分布式文件系统HDFS
HDFS HDFS官网http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html HDFS架构(HBase和YARN都是这种架构) 1个Master带N个Slaves,Master就是NameNode(NN),Slaves就是DataNode(DN) 1个文件会被拆分成多个Blo...
2018-03-20 23:03:02 163
原创 Java的线程池
何为进程? 资源分配的最小单元,(资源包括:表格,内存空间,磁盘空间)同一进程中的多条线程讲共享该进程中的资源 何为线程 CPU调度的最小单元,线程只有相关堆栈中的寄存器和线程控制表组成,而寄存器可被用来存储线程内的局部变量 线程安全是指什么? 只有单例模式下共享全局变量才会导致线程不安全问题 锁 分为隐式锁和显示锁;Synchronized是隐式锁,加在对象上的。显示锁:lock,需要...
2018-03-14 21:35:43 164
原创 大数据入门
Hadoop生态圈技术 初识Hadoop: apache下面的开源产品 通常指的是生态圈,包括HDFS,YARN,Hive 用于搭建大型数据仓库 用于PB级分布式数据存储,处理,分析,统计 存储在廉价的机器上,具有成熟的生态圈 文件系统HDFS: 将文件切分成指定大小的数据块并以多副本存储在多个机器上 Hadoop实现了一个分布式文件系统 YARN: - 负责整个集群...
2018-03-14 19:37:18 181
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人