NoSQL综述

什么是NoSQL

  • NoSQL:not only SQL,非关系型数据库
  • NoSQL是一个通用术语
    指不遵循传统RDBMS模型的数据库
    数据是非关系的,且不使用SQL作为主要查询语言
    解决数据库的可伸缩性和可用性问题
    不针对原子性或一致性问题

为什么使用NoSQL

  • 互联网的发展,传统关系型数据库存在瓶颈
    (1)高并发读写
    (2)高存储量
    (3)高可用性
    (4)高扩展性
    (5)低成本

NoSQL与关系型数据库的区别

对比NoSQL关系型数据库
常用数据库HBase,MongoDB,RedisOracle,DB2, MySQL
存储格式文档,键值对,图结构表格是,行和列
存储规范鼓励冗余规范性,避免重复
存储扩展横向发展,分布式纵向扩展(横向扩展有限)
查询方式结构化查询语言SQL非结构化查询
事务不支持事务一致性支持事务
性能读写性能高读写性能差
成本简单易部署,开源,成本低成本高

NoSQL的特点

  • 最终一致性
  • 应用程序增加了维护一致性和处理事务等职责
  • 冗余数据存储
  • NoSQL!=大数据
    NoSQL产品是为了帮助解决大数据存储问题
    大数据不仅仅包含数据存储的问题(还包含大数据计算,大数据采集,大数据应用等)

NoSQL基本概念

  • 三大基石
    CAP,BASE,最终一致性
  • Indexing(索引),Query(查询)
  • MapReduce
  • Sharding

(1)CAP理论

数据库最多支持三个中的两个
Consistency(一致性)
Availability(可用性)
Partition Tolerance(分区容错性)

NoSQL不保证"ACID"
提供"最终一致性"

(2)BASE

Basically Available(基本可用):保证核心可用
Soft-state(软状态):状态可以有一段时间不同步
Eventual Consistency(最终一致性):系统经过一定时间后,数据最终能够达到一致的状态

核心思想是即使无法做到强一致性,但应用可以选择适合的方式达到最终一致性

(3)最终一致性

最终结果保持一致性,而不是时时一致
如账户余额,库存量等数据需要强一致性
如catalog等信息不需要强一致性

(4)索引和查询

  • Indexing(索引)
    大多数NoSQL是按key进行索引
    部分NoSQL允许二级索引
    HBase使用HDFS,app-only:批处理写入Logged/重新创建并排序文件

  • Query(查询)
    没有专门的查询语言,通常使用脚本语言查询
    有些开始支持SQL查询
    有些可以使用MapReduce代码查询

(5)MapReduce,Sharding

  • MapReduce
    不是Hadoop的MapReduce,概念相关
    可进行数据的处理查询

  • Sharding(分片)
    一种分区模式
    可以复制分片:有利于灾难恢复

NoSQL分类

分类举例典型应用场景
键值存储数据库(key-value)Redis,MemcacheDB,Voldemort内容缓存等
列存储数据库(WIDE COLUMN STORE)Cassandra,Hbase应对分布式存储的海量数据
文档型数据库(DOCUMENT STORE)CouchDB,MongoDBWeb应用(可看做键值数据库的升级版)
图数据库(GRAPH DB)Neo4j,InfoGrid,Infinite Graph社交网络,推荐系统等,专注于构建关系图谱

NoSQL和BI,大数据的关系

  • BI(Business Intelligence):商务智能
    它是一套完整的解决方案
    BI应用涉及模型,模型依赖于模式
    BI主要支持标准SQL,对NoSQL支持弱于关系型数据库

  • NoSQL和大数据相关性较高
    通常大数据场景采用列存储数据库
    如:HBase和Hadoop

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
关系型数据库NoSQL数据库 什么是NoSQL 大家有没有听说过“NoSQL”呢?近年,这个词极受关注。看到“NoSQL”这个词,大家可能会误以为是“No!SQL”的缩写,并深感愤怒:“SQL怎么会没有必要了呢?”但实际上,它是“Not Only SQL”的缩写。它的意义是:适用关系型数据库的时候就使用关系型数据库,不适用的时候也没有必要非使用关系型数据库不可,可以考虑使用更加合适的数据存储。 为弥补关系型数据库的不足,各种各样的NoSQL数据库应运而生。 为了更好地了解本书所介绍的NoSQL数据库,对关系型数据库的理解是必不可少的。那么,就让我们先来看一看关系型数据库的历史、分类和特征吧。 关系型数据库简史 1969年,埃德加•弗兰克•科德(Edgar Frank Codd)发表了划时代的论文,首次提出了关系数据模型的概念。但可惜的是,刊登论文的《IBM Research Report》只是IBM公司的内部刊物,因此论文反响平平。1970年,他再次在刊物《Communication of the ACM》上发表了题为“A Relational Model of Data for Large Shared Data banks”(大型共享数据库的关系模型)的论文,终于引起了大家的关注。 科德所提出的关系数据模型的概念成为了现今关系型数据库的基础。当时的关系型数据库由于硬件性能低劣、处理速度过慢而迟迟没有得到实际应用。但之后随着硬件性能的提升,加之使用简单、性能优越等优点,关系型数据库得到了广泛的应用。 通用性及高性能 虽然本书是讲解NoSQL数据库的,但有一个重要的大前提,请大家一定不要误解。这个大前提就是“关系型数据库的性能绝对不低,它具有非常好的通用性和非常高的性能”。毫无疑问,对于绝大多数的应用来说它都是最有效的解决方案。 突出的优势 关系型数据库作为应用广泛的通用型数据库,它的突出优势主要有以下几点: 保持数据的一致性(事务处理) 由于以标准化为前提,数据更新的开销很小(相同的字段基本上都只有一处) 可以进行JOIN等复杂查询 存在很多实际成果和专业技术信息(成熟的技术) 这其中,能够保持数据的一致性是关系型数据库的最大优势。在需要严格保证数据一致性和处理完整性的情况下,用关系型数据库是肯定没有错的。但是有些情况不需要JOIN,对上述关系型数据库的优点也没有什么特别需要,这时似乎也就没有必要拘泥于关系型数据库了。 关系型数据库的不足 不擅长的处理 就像之前提到的那样,关系型数据库的性能非常高。但是它毕竟是一个通用型的数据库,并不能完全适应所有的用途。具体来说它并不擅长以下处理: 大量数据的写入处理 为有数据更新的表做索引或表结构(schema)变更 字段不固定时应用 对简单查询需要快速返回结果的处理 。。。。。。 NoSQL数据库 为了弥补关系型数据库的不足(特别是最近几年),NoSQL数据库出现了。关系型数据库应用广泛,能进行事务处理和JOIN等复杂处理。相对地,NoSQL数据库只应用在特定领域,基本上不进行复杂的处理,但它恰恰弥补了之前所列举的关系型数据库的不足之处。 易于数据的分散 如前所述,关系型数据库并不擅长大量数据的写入处理。原本关系型数据库就是以JOIN为前提的,就是说,各个数据之间存在关联是关系型数据库得名的主要原因。为了进行JOIN处理,关系型数据库不得不把数据存储在同一个服务器内,这不利于数据的分散。相反,NoSQL数据库原本就不支持JOIN处理,各个数据都是独立设计的,很容易把数据分散到多个服务器上。由于数据被分散到了多个服务器上,减少了每个服务器上的数据量,即使要进行大量数据的写入操作,处理起来也更加容易。同理,数据的读入操作当然也同样容易。 提升性能和增大规模 下面说一点题外话,如果想要使服务器能够轻松地处理更大量的数据,那么只有两个选择:一是提升性能,二是增大规模。下面我们来整理一下这两者的不同。 首先,提升性能指的就是通过提升现行服务器自身的性能来提高处理能力。这是非常简单的方法,程序方面也不需要进行变更,但需要一些费用。若要购买性能翻倍的服务器,需要花费的资金往往不只是原来的2倍,可能需要多达5到10倍。这种方法虽然简单,但是成本较高。 另一方面,增大规模指的是使用多台廉价的服务器来提高处理能力。它需要对程序进行变更,但由于使用廉价的服务器,可以控制成本。另外,以后只要依葫芦画瓢增加廉价服务器的数量就可以了。 不对大量数据进行处理的话就没有使用的必要吗? NoSQL数据库基本上来说为了“使大量数据的写入处理更加容易(让增加服务器数量更容易)”而设计的。但如果不是对大量数据进行操作的话,NoSQ

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值