大数据之所以成为大数据,首先就是他的体量真的非常巨大。随着21世纪的来临,我们迎来了数据信息大爆炸的时代。移动互联、社交网络、电子商务等极大拓展了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。互联网(社交、搜索、电商)、移动互联网(微博)、物联网(传感器,智慧地球)、车联网、GPS、医学影像、安全监控、金融(银行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。
在接下来量化描述海量数据之前,我们先来科普一下数字数据的单位:最小的基本单位是bit,按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
1KB(Kilobyte千字节)=1024B;
1MB(Megabyte兆字节)=1024KB;
1GB(Gigabyte吉字节)=1024MB;
1TB(Trillionbyte太字节)=1024GB;
1PB(Petabyte拍字节)=1024TB;
1EB(Exabyte艾字节)=1024PB;
1ZB(Zettabyte泽字节)=1024EB;
1YB(YottaByte尧字节)=1024ZB;
1BB(Brontobyte)=1024YB;
1NB(NonaByte)=1024BB;
1DB(DoggaByte)=1024NB;
在大多数人都还只知道TB的时候,我们在数字数据单位上已经提升了7个数量级到了DB时代。2006年,个人用户刚刚迈进TB时代,当年全球一共产生了180EB的数据;而在2011年,全球数据生产量就已经达到了惊人的1.8ZB;
根据IDC监测,到2020年,整个世界的数据总量将会增长44倍,达到35.2ZB(1ZB=10亿TB)!人类产生的数据量大约每两