KMGTPEZY;
1. 网页
2008 年,全球互联网的网页超过 1万亿( 1012=(103)4 ,也即 k ⇒ m ⇒ g ⇒ t ⇒ p),按平均每个网页 10KB 计算,
10×1012=10PB
2. 电话
一个两亿用户( 2×108 )的电信运营商,平均每个用户每天拨打接听总共 10 次电话,每次电话 400 B,则 5 年的话费记录总量为:
5×365×10×0.4×2×108=1.46PB
吴军老师的《智能时代》给出的另一种产生数据来源的总结:
- 第一个来源:电脑(数字化的)本身,
- 这些电脑或者设备中内置的处理器、传感器和控制器一直在产生数据,比如记录设备状态的日志(Log)
- 第二个来源:传感器;
- RFID,万物互联离不开传感器;
- 第三个来源:那些过去已经存在的、以非数字化形式存储的信息重新数字化;