hadoop基础
thy的博客
这个作者很懒,什么都没留下…
展开
-
Linux系统构造
什么是服务器虚拟化 把若干分散的物理服务器虚拟为一个大的逻辑服务器,比如网格技术 常见的虚拟化解决方案 1.裸设备 Openstack ESXI 2.依赖于操作系统 Vmware Workstation Oracle VM VirtualBox Hyper-V Ducker Linux简介 Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持...原创 2018-12-19 23:29:57 · 96 阅读 · 0 评论 -
大数据hadoop基础
常用数据库存储方案 1.数据仓库解决方案(DWH) DB2,Oracle,SQL Server SSRS 2.NoSQL MongoDB(文本 执行效率比sql好 和Redis比较MongoDB好),Redis(基于内存地址的,单进程),Cassandra 3.内存数据库 SAP HANA(是世界上最好的数据库),Exasol EXASolution 4.Hadoop生态 Hive,Hbase,I...原创 2019-01-05 19:43:20 · 218 阅读 · 1 评论 -
什么是大数据、什么是云计算
hadoop基础 什么是大数据 大数据是指以多元形式,自许多来源搜集而来的庞大数据组,往往具有实时性。在企业对企业销售的情况下,这些数据可能得自社交网络、电子商务网站、顾客来访纪录,还有许多其他来源。这些数据,并非公司顾客关系管理数据库的常态数据组。 云计算 云计算是一种商业计算模型。它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。 云计算的特...原创 2018-12-18 22:56:07 · 580 阅读 · 0 评论 -
搭建NAT模式虚拟机
hello搭建NAT模式虚拟机 搭建NAT模式虚拟机 1.新建虚拟机向导(2个选哪个都行) 2.(这个不要动) 3.这个选择稍后安装操作系统 4.这一步选择 linux 5.填写虚拟机名字和存放路径 6.这个不要动 7.这个安照2G(2048)写。1G内存怕不够用 8.这个我是使用的net模式(不用动) 9.不用动(默认) 10.不用动(默认) 11.这个选择创建新虚拟磁盘 ...原创 2019-01-03 22:16:40 · 344 阅读 · 0 评论 -
Hadoop三大核心(HDFS,YARN,MapReduce)
Hadoop三大核心 1.HDFS HDFS是分布式文件系统,有高容错性的特点,可以部署在价格低廉的服务器上,主要包含namenode和datanode。 Namenode是hdfs中文件目录和文件分配管理者,它保存着文件名和数据块的映射管理,数据块和datanode列表的映射关系。 其中文件名和数据块的关系保存在磁盘上,但是namenode上不保存数据块和datanode列表的关系,该列表是通过...原创 2019-01-07 19:23:07 · 2050 阅读 · 0 评论