1)数据的单位和换算关系:
1Byte = 8 bit
1 KB = 1,024 Bytes
1 MB = 1,024 KB = 1,048,576 Bytes
1 GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes
1 TB = 1,024 GB = 1,048,576 MB = 1,073,741,824 KB = 1,099,511,627,776 Bytes
1 PB = 1,024 TB = 1,048,576 GB =1,125,899,906,842,624 Bytes
1 EB = 1,024 PB = 1,048,576 TB = 1,152,921,504,606,846,976 Bytes
1 ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes
1 YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes
1 DB = 1024 YB = 1,237,940,039,285,380,274,899,124,224 Bytes
1 NB = 1024 DB = 1,267,650,600,228,229,401,496,703,205,376 Bytes
2)大数据与SOA的关系
SOA的三个数据中心模型: DaaS模型(数据即服务)、物理层次结构模型、架构组件模型。
DaaS数据存取的模型描述了数据是如何提供给SOA组http://write.blog.csdn.net/postedit件的。物理模型描述了数据是如何存储的以及存储的层次图是如何传送到SOA数据存储器上的。最后,架构模型描述了数据、数据管理服务和SOA组件之间的关系。
SOA数据关系中的架构模型,有水平方向和垂直方向两种,水平数据模型更加适合SOA。解决的方法是MapReduce,可以应用于Hadoop形式的云构架。
3)大数据的存储问题
以下几个问题不可忽略:
容量问题,延迟问题,安全问题,成本问题,数据积累问题,灵活性,小用户的大数据等
4)ApachHadoop
包括三大部分: HDFS (Hadoop Distributed File System), HadoopMapReduce编程模型,Hadoop Common
流: 流失通过边缘连接的节点图,每个节点是运算符或适配器
IBM InfoSphere Streams: 数据将会流过有能力操控数据流的运算符,然后对数据进行动态分析,分析触发大量事件,使企业利用即时的只能实时。
5)IBM大数据平台:
Hadoop 系统
流计算
数据仓库
语境搜索
信息整合与治理