NoSQL介绍
- 什么是NoSQL
NoSQL是非关系型数据库,是用来存储数据的。类似关系型数据库,代表为MySQL。还包括SQL server 、Oracle 等。他们具有一个共同的特点就是可以使用SQL语句{增(INSERT)、删(DELETE)、改(UPDATE )、查(SELECT)},对于非关系型数据库来说没有这样的SQL语句的用法。 - 对于关系型数据库来说,是需要把数据存储到库、表、行、字段里,查询的时候根据条件一行一行的去匹配,当量非常大的时候就很耗费时间和资源,尤其是数据需要从磁盘里去检索
- NoSQL数据库存储原理非常简单(典型的数据类型为K-V),不存在繁杂的关系链,比如mysql查询的时候,需要找到对应的库、表(通常是多个表)以及字段
- NoSQL数据可以存储在内存中,查询速度非常快。
- NoSQL在性能上虽优于关系型数据库,但是它并不能完全替代关系型数据库,因为设计简单,当遇到一些特殊的需求时,NoSQL并不能满足。
- NoSQL因为没有复杂的数据结构,扩展非常容易,支持分布式(数据量很大、访问量达到瓶颈通过增加服务器来实现横向扩展),针对这种情况mysql常用以下2种办法:(1)增加多台机器,同步数据,做主从,然后在对从进行负载均衡。(2)分库分表,但是只有不关联的才可以分开。
- 常见的NoSQL数据库
(1)K-V形式:memcached、redis适合存储用户信息,比如会话、配置文件、参数、购物车等。这些信息一般都和ID(键)挂钩,这种情景下键值数据库是个很好的选择。
(2)文档数据库:mongodb 将数据以文档的形式储存。每个文档都是一系列数据项的集合。每个数据项都有一个名称与对应的值,值既可以是简单的数据类型,比如字符串、数字和日期等;也可以是复杂的类型。如有序列表和关联对象。数据存储的最小单位是文档,同一个表中存储的文档属性可以是不同的,数据可以使用XML,JSON或者JSONB等多种形式存储。
(3)列储存 Hbase
(4)图 Ne04J、infinite Graph 、OrientDB
memcached介绍
-
Memcached是国外社区网站LiveJournal团队开发,目的是为了通过缓存数据库查询结果,减少数据库访问次数,从而提高动态web站点性能。
-
数据结构简单(K-V),数据存放在内存里。它的数据不支持落地,不支持持久化,意味着重启服务器或者服务都会导致之前存储的数据丢失。为了保证数据安全,可以定期将数据存储到硬盘之中,如果要重启服务,可以将数据先导入磁盘中,重启后服务后再导入。
-
多线程(当CPU较多时,使用memcached可以明显感觉速度快)
-
基于C/S架构,协议简单
-
基于libevent的事件处理
-
自主内存存储处理(slab allowcation)
-
数据过期方式:Lazy Expiration 和 LRU
-
memcached的数据流
执行过程:
用户发起请求给NGINX,然后再次调用PHP,PHP和mysql打交道,当用户PHP获取到请求转给NGINX,NGINX再次把请求数据交给用户。如果并发量很大,请求mysql的队列比较多,这时候就需要增加一个缓存层Memcached。这样访问过的数据全部丢在缓存中,当再次请求这个数据的时候就直接从Memcached读取即可。
-
Slab allocation
chunk:属于最小的单元
page: 包含多个chunk
slab:包含多个page
slab Aollcation原理
(1) 将分配的内存分割成各种尺寸的块(Chunk),并把相同的块分成组(chunk的集合),每个chunk集合被称为slab
(2). memcahced的内存分配以Page为单位,它的默认值为1M,可以在启动时通过-I参数来指定
(3). Slab是由多个Page组成的,page按照指定大小切割成多个chunk。
Growth factor
(1)memcached在启动时可以通过-f选项来指定Growth factor增长因子,该值控制chunk大小的差异,默认值为1.25
(2)通过memcached-tool命令查看指定memcached实例的不同slab状态,可以看到各item所占大小(chunk大小)差距为1.25
(3)命令:memcached-tool 127.0.0.1:11211 dispaly
memcached的数据过期方式
(1)lazy expiration
memcached内部不会监控记录是否过期,而是在get时查看记录饿时间戳,检查记录是否过期。这种技术被称为lazy(惰性)Expiration。因此memcached不会在过期监视上耗费CPU时间。
(2)LRU
memcached会优先使用已超时的记录的空间,但即使如此,也会发生追加新记录时空间不足的情况,此时就要使用名为Least Recently Used(LRU)机制来分配空间。顾名思义就是删除“最近最少使用”的记录的机制。因此,当内存空间不足时(无法从slab class获取到新的空间时),就从最近未被使用的记录中搜索,并将其空间分配给新的记录。从缓存的实用角度看,该模型十分理想。