草稿
4V 就不说了。
网页、日志、数据仓库、广告数据、UGC(BBS, 微博,评论等).
结构化与非结构化并存,系统数据对数据一致性要求强弱程度不同,用户对数据的访问行为存在不确定性,即在毫无征兆的情况下,对某些信息进行突发式访问等。
局部更新,冷热不均,突发性。
数据全局排序,顺序写和随机写的问题。
性能: 高吞吐,低延迟,高并发。
大小: 小记录(KB) VS 大记录(TB)
规模: PB vs TB
数据组织:有序VS 无序,结构化和非结构化
时效性: 实时VS 非实时
一致性: 弱VS强
读写: 易变VS 静态
处理方式: 顺序批量VS 局部随机。