在 互联网的世界里面,数据的存储是最核心的环节之一,互联网就是解决了2个问题:数据的存储、数据的计算;那数据库是数据存储最核心的方式了;随着数据库的发展,数据库也分了很多种类,这些数据库没有好坏之分,只有业务场景是否合适;
1. 关系型数据库
- mysql
- oracle
- sqlserver
- db2
2. NoSQL 数据库
- kv store /tair/缓存/memched/redis
- mongDB
- graphDB
- pgresql
- hbase
hbase 是hadoop 生态系统中的一个子系统,是google bigtable 的开源实现;是一种非结构化、分布式的数据库系统;主要的优点还是跟hadoop 集群的MapReduce 的job 完美的结合在一起,Job 离线计算产出的数据直接批量写入hbase,供在线服务用hive 进行查询;所以hbase 的特点是高写入的同时有大量查询、schmea又是可能变化的,这种业务场景hbase 将是不二选择。
hbase 还是一个非结构化(关系型数据库是结构化),面向列的分布式数据库,每一个行有不同的列,列可以随时定义、修改;MR 每次批量导入的数据列数也可能不一致
3. 云数据库(ApsraDB)
- RDS
- OSS
- OTS