NoSQL数据模型简介
1.以一个电商客户、订单、订购、地址模型来对比下关系型数据库和非关系型数据库
客户表
订单表
订购表
收货地址
支付表
2.什么是BSON
BSON()是一种类json的一种二进制形式的存储格式,简称Binary JSON,它和JSON一样,支持内嵌的文档对象和数组对象
{ "customer":
{ "id":1136, "name":"Z3", "billingAddress":
[{"city":"beijing"}],
"orders":[{
"id":17,
"customerId":1136,
"orderItems":[{"productId":27,"price":77.5,"productName":"thinking in java"}], "shippingAddress":[{"city":"beijing"}] "orderPayment":[{"ccinfo":"111-222-333","txnid":"asdfadcd334","billingAddress":{"city":"beijing"}}],
}]
}
}
3.聚合模型
KV键值, bson, 列族, 图形
列族:顾名思义,是按列存储数据的。最大的特点是方便存储结构化和半结构化数据,方便做数据压缩,对针对某一列或者某几列的查询有非常大的IO优势。
4.NoSQL数据库的四大分类
KV键值:典型介绍
新浪:BerkeleyDB+redis,美团:redis+tair,阿里、百度:memcache+redis
文档型数据库(bson格式比较多):典型介绍
CouchDB,MongoDB
列存储数据库
Cassandra, HBase,分布式文件系统
图关系数据库
它不是放图形的,放的是关系比如:朋友圈社交网络、广告推荐系统
社交网络,推荐系统等。专注于构建关系图谱
Neo4J, InfoGrid
四者对比:
5.在分布式数据库中CAP原理CAP+BASE
传统的ACID分别是什么?
A (Atomicity) 原子性,C (Consistency) 一致性,I (Isolation) 独立性,D (Durability) 持久性
CAP是什么?
C:Consistency(强一致性),A:Availability(可用性),P:Partition tolerance(分区容错性)
经典的CAP?
CAP理论的核心是:
一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个。
因此,根据 CAP 原理将 NoSQL 数据库分成了满足 CA 原则、满足 CP 原则和满足 AP 原则三 大类:
CA - 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。 ——传统数据库Oracle
CP - 满足一致性,分区容忍必的系统,通常性能不是特别高。 ——大多数网站架构选择
AP - 满足可用性,分区容忍性的系统,通常可能对一致性要求低一些。 ——Redis,Mongodb
BASE?
BASE就是为了解决关系数据库强一致性引起的问题而引起的可用性降低而提出的解决方案。
BASE其实是下面三个术语的缩写:
基本可用(Basically Available)
软状态(Soft state)
最终一致(Eventually consistent)
它的思想是通过让系统放松对某一时刻数据一致性的要求来换取系统整体伸缩性和性能上改观。为什么这么说呢,缘由就在于大型系统往往由于地域分布和极高性能的要求,不可能采用分布式事务来完成这些指标,要想获得这些指标,我们必须采用另外一种方式来完成,这里BASE就是解决这个问题的办法
分布式+集群简介?
分布式系统分布式系统(distributed system) 由多台计算机和通信的软件组件通过计算机网络连接(本地网络或广域网)组成。
分布式系统是建立在网络之上的软件系统。正是因为软件的特性,所以分布式系统具有高度的内聚性和透明性。
因此,网络和分布式系统之间的区别更多的在于高层软件(特别是操作系统),而不是硬件。
分布式系统可以应用在在不同的平台上如:Pc、工作站、局域网和广域网上等。
简单来讲:
1分布式:不同的多台服务器上面部署不同的服务模块(工程),他们之间通过Rpc/Rmi之间通信和调用,对外提供服务和组内协作。
2集群:不同的多台服务器上面部署相同的服务模块,通过分布式调度软件进行统一的调度,对外提供服务和访问。