hadoop
文章平均质量分 73
lxmm1999
这个作者很懒,什么都没留下…
展开
-
尚硅谷Hadoop 02框架搭建
概念Hadoop是什么分布式系统:多台服务器共同完成一项任务Hadoop是Apache开发的分布式体统基础架构,主要解决海量数据的存储和分析计算广义来说,Hadoop指Hadoop生态圈,包括Hive、Hbase等Hadoop发展历史Hadoop发行版本Hadoop优势Hadoop组成大数据技术生态体系推荐系统案例环境准备模板虚拟机准备克隆安装JDK、HadoopHadoop生产集群搭建本地模式完全分布式集群(核心)常见错误解决方案...原创 2021-03-17 10:58:31 · 732 阅读 · 0 评论 -
尚硅谷Hadoop 01概述
知识框架详细思维导图(1111资料来源于尚硅谷)版本 Hadoop3.1.3大数据主要解决海量数据的采集,存储,分析大数据特点(4V)Volume(大量) 大企业数据量接近EB量级(1EB=1024PB 1PB=1024TB)Velocity(高速) 数据产生快Variety(多样)分为结构化数据和非结构化数据Value(低价值密度) 大量数据中有价值的少(数据清洗)应用场景电商、短视频app的推荐系统零售行业分析消费习惯 eg. 纸尿裤+啤酒物流仓储 eg. 京东物流原创 2021-03-17 10:26:23 · 107 阅读 · 0 评论