早期的数据库都是单库的,因为数据量不大,访问量不高,所以扛得住,随着互联网业务的不断发展,数据量越来越大,数据的表现形式也越来越丰富,这时候出现了数据库集群,比如读写分离等,再后来出现了分库分表,这些是单靠加机器,从物理层面解决问题,但是随着用户量的暴涨,关系型数据库可能就扛不住了,这时候出现了NoSQL数据库。
NoSQL=Not Only SQL
NoSQL的特点:
- 方便扩展(数据之间没有关联)
- 高性能(Redis每秒8万次写,11万次读,缓存是记录级的,是一种细粒度的缓存)
- 数据类型多样化,不需要提前设计数据库,随取随用
- 和传统的RDBMS相比,操作更加方便
在实际的工作中,需要RDBMS和NoSQL一起使用,才能发挥出最强的性能,它们各有各的优劣。
- NoSQL四大分类
分类 | 举例 | 应用场景 | 数据模型 | 优点 | 缺点 |
---|---|---|---|---|---|
键值(Key-Value) | Redis | 内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统等 | Key指向Value的键值对,通常用hash table来实现 | 查找速度快 | 数据无结构化,通常只被当作字符串或者二进制数据 |
文档型数据库 | MongoDB | Web应用(与Key-Value类似,Value是结构化的,不同的是数据库能够了解Value的内容) | Key-Value对应的键值对,Value为结构化数据 | 数据结构要求不严格,表结构可变,不需要像关系型数据库一样需要预先定义表结构 | 查询性能不高,而且缺乏统一的查询语法 |
列存储数据库 | HBase | 分布式的文件系统 | 以列簇存储,将同一列数据存储在一起 | 查找速度快,可扩展性强,更容易进行分布式扩展 | 功能相对局限 |
图形数据库 | Neo4J | 社交网络,推荐系统等,专注于构建关系图谱 | 图结构 | 利用图结构相关算法,比如最短路径寻址,N度关系查找等 | 很多时候需要对整个图做计算才能得出需要的信息,而且这种结构不好做分布式集群方案 |