自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (4)
  • 收藏
  • 关注

原创 hive小结

hive hive是建立在Hadoop上的数据仓库基础架构,将sql语句转化为MapReduce在Hadoop上执行。 hive优化 表优化:分区表,防止全表扫描,桶表。 sql优化:map端join,where优化(先执行where缩小数据),groupby自动优化 job优化:并行执行,本地执行,合并输入、输出小文件,压缩数据。 map优化:map端聚合,推测执行 red

2015-10-24 18:35:57 368

原创 hadoop知识点总结

HDFS 读流程 filesystem类是一个抽象类,其实现类是distributedfilesystem,打开文件时调用其open方法,DFSclient通过rpc协议获取namenode的代理对象,得到块的信息,返回FSdatainputstream对象,通过其read方法连接到datanode读取数据,数据读取完毕时关闭FSdatainputstream。 写流程 写入文件时调用cr

2015-10-24 15:31:25 347

原创 hbase小结

hbase原理 HBase是一个构建在HDFS上的分布式列存储系统。 在架构上hbase由hmaster和hregionserver组成,他们之间依靠zookeeper进行通信。 在数据模型上由行健、列族、列族限定符、时间戳、值组成。 在物理模型上region存储一个表的一定行健范围内的数据,region由多个hstore组成,hstore存储某个列族的memostore和storefil

2015-10-24 11:32:53 741

oracle11g-el7依赖

binutils-2.23.52.0.1-12.el7.x86_64 compat-libcap1-1.10-3.el7.x86_64 compat-libstdc++-33-3.2.3-71.el7.i686 compat-libstdc++-33-3.2.3-71.el7.x86_64 gcc-4.8.2-3.el7.x86_64 gcc-c++-4.8.2-3.el7.x86_64 glibc-2.17-36.el7.i686 glibc-2.17-36.el7.x86_64 glibc-devel-2.17-36.el7.i686 glibc-devel-2.17-36.el7.x86_64 ksh

2018-06-21

python连接oracle包

centos6下python3连接oracle11g,cx_Oracle-6.2.1-cp36-cp36m-manylinux1_x86_64.whl,oracle-instantclient11.2-basic-11.2.0.1.0-1.x86_64.rpm

2018-04-23

gcc升级依赖包

gcc升级依赖包,gcc-5.4.0.tar.gz,centos6下gcc升级至gcc-5.4.0

2018-04-23

gcc安装依赖包

centos6下gcc安装依赖包,gcc-4.4.7-4.el6.x86_64.rpm、gcc-c++-4.4.7-4.el6.x86_64.rpm、cpp-4.4.7-4.el6.x86_64.rpm等

2018-04-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除