欢迎关注,敬请点赞!
生态化反——hadhoop生态圈
hadhoop动物园
返回顶部
apache开源的分布式计算框架(一系列产品)。
- HDFS(hadhoop distribute file system),很平滑,不够就加普通PC,冗余备份,(参考raid0 1 2 3 4 5) ,pd.read_hdf(),pandas也可以读
- MapReduce(YARN2.0),分布式计算框架,求和、字频;不能分布计算,序列式(圆周率、斐波那契数列);将不能分布式改成分布式。
- HIVE(模仿SQL