一、Hadoop
解决问题:
海量数据存储HDFS(分布式存储系统,分散到集群的很多机器上);
海量数据计算mapreduce;
资源管理调度YARN;
hadoop很多框技术架构成的生态系统。将生成数据文本文件,hadoop对文本文件进行处理。
hdfs
吞吐量即并发能力。
hadoop访问hdfs:
hadoop fs -ls(显示)/-cat(查看)/-put(放置)/-get(获取)
传达hdfs根目录上:
从hdfs上下载:
ssh 远程连接:两台主机免密登陆(通过