自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

dazheng

数据产生价值

  • 博客(5)
  • 资源 (7)
  • 收藏
  • 关注

原创 大规模数据管理系统调查(学习笔记)

介绍大数据的四个特性 Volume(体量)、Velocity(速度)、Variety(多样性)、Veracity(精确性)应对 介绍基本情况 Data modelSystem architectureConsistency model基本实现原理 数据模型和数据分区SEDA/MapReduce架构高扩展性基于timestamps的并发控制协议强一致性模型扩展约束BASE模型及

2015-08-16 14:41:59 1280

翻译 Big Data Lambda Architecture 翻译

Big DataLambda ArchitecturePosted on September5, 2012 by dbtubeIn orderto meet the challenges of Big Data, you must rethink data systems from theground up. You will discover that some of the most

2015-08-04 21:06:36 1408

原创 Linux\AIX 常用

1、编辑linux内核 1. 在/usr/src下untar这个包. tar -xjf linux-2.6.25.tar.bz2 2. 配置内核 cd /usr/src mv linux-2.6.25 linux cd linux make mrproper #(删除一些stable的文件,针对刚do

2015-08-03 15:20:12 698

原创 CentOS6.4上安装配置snappy

1、下载 [hadoop@master pub]$ wget https://snappy.googlecode.com/files/snappy-1.1.0.tar.gz2、安装 [hadoop@master snappy-1.1.0]$ sudo yum install gcc gcc+ gcc-c++ [hadoop@master bin]$ tar axvf snap

2015-08-03 15:08:31 5047 1

原创 Hive常用

主要整理于2011、2012年1、启动server及元数据 nohup hive --service hiveserver2 10000 > /dw/log/hiveserver.log 2>&1 & nohup hive --service metastore 9083 > /dw/log/metastore.log 2>&1 &2、字符集 hive元数据存储用mys

2015-08-03 15:05:40 716

linux shell介绍

自己参照各种资料,结合开发中实际遇到的问题,整理而成。欢迎下载使用

2015-07-16

ETL DataStage实现

自己写的用DataStage实现ETL,主要给初学者一个对整体的认识,同时提供了些常用的资源

2010-04-20

Bash高级编程指南英语版

此版为英文版6,从CSDN上下了中文版的,感觉翻译的不是太好,特上传了英语版的

2009-08-19

oracledbbestpracticesforadatawarehouse

Oracle官方的白皮书。在数据仓库项目中,使用oracle数据库,从规划到逻辑模型,物理模型,维护等方面,都结合oracle的特性,深入讲解了实现方式及注意事项,是用oracle做数据仓库项目的非常好的参考资料

2009-03-30

SQL Bible

此文档介绍了SQL的知识,同时结合oracle、SQL Server、DB2三种数据库,讲了这三种主流数据库的共性及区别

2008-01-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除