自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

fanxuemin_Jay的博客

大数据技术分享

  • 博客(3)
  • 收藏
  • 关注

原创 HDFS读写原理

namenode职责:    1. 响应所有客户端的请求    2.维护整个文件系统元数据(目录树,文件快的对应信息)    3.管理众多datanodehadoop fs -put 1.txt /aaa(shell客户端上传文件流程,写数据)    1. shell客户端请求(RPC)namenode上传文件,namenode检查datanode的节点健康状况和磁盘使用情况    2. name...

2018-04-30 22:02:48 279

原创 hadoop的核心组件和HDFS存储数据原理

Hadoop核心组件(主从集群)HDFS(分布式文件系统,集群):解决数据的存储,其角色:namenode(主), datanode, secondarynamenode(主的秘书)YARN(作业调度和集群资源管理的框架,集群):解决资源任务调度,其角色:resourcemanager(主),nodemanager(从)MAPREDUCE(分布式运算编程框架):解决海量数据计算集群角色规划    ...

2018-04-30 20:09:47 825

原创 数据仓库和hive语句中的分区表和分桶表

    数据仓库中从各数据源获取数据以及在数据仓库内的数据转换和流动都可以认为是ETL(抽取Extra,转化Transfer,装载Load)的过程,ETL是数据仓库的流水线.数据仓库(data warehouse)与数据库的区别:数据仓库(data warehouse)-->面向分析, 不生产数据, 不消费数据, 只是数据的搬运工, 为了分析方便OLTP-->面向事务, 操作型处理, ...

2018-04-23 19:39:05 1579

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除