redis五种数据结构:String(字符串)、Hash(哈希)、List(列表)、Set(集合)、Zset(即Sorted Set有序集合)
String(字符串):
特点:string的一个键最大能存储512MB。
存储形式:键值对
使用场景:各种缓存数据、存储session(如何存储)、手机验证码限速、
Hash(哈希):
特点:每个 hash 可以存储 232 -1 键值对(40多亿)。
存储形式:键值对的集合。
使用场景:存储对象,例如存储、读取、修改用户属性
List(列表):
特点:列表最多可存储 232 - 1 元素 (4294967295, 每个列表可存储40多亿)。
存储形式:字符串列表,可以从左插入或从右插入
使用场景:消息队列(商城秒杀,用户注册成功后发送确认邮件,最新发布的消息)
使用技巧:
lpush+lpop=Stack(栈)lpush+rpop=Queue(队列)lpush+ltrim=Capped Collection(有限集合)lpush+brpop=Message Queue(消息队列)
Set(集合):
特点:set集合内元素具有唯一性,所以插入相同的元素将会无效。
存储形式:string类型元素的集合。
使用场景:共同好友(求交集),利用唯一性统计访问网站的所有独立ip,(好友推荐时,根据tag求交集,大于某个阈值就可以推荐)
Zset(即Sorted Set有序集合):
特点:不允许重复的成员,
存储形式:string类型元素的有序集合,每一个元素都会关联一个double类型的分数。
使用场景:排行榜,带权重的消息队列
事务:
单个 Redis 命令的执行是原子性的,但 Redis 没有在事务上增加任何维持原子性的机制,所以 Redis 事务的执行并不是原子性的。事务可以理解为一个打包的批量执行脚本,但批量指令并非原子化的操作,中间某条指令的失败不会导致前面已做指令的回滚,也不会造成后续的指令不做。
redis快速的原因
完全基于内存,采用多路 I/O 复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络IO的时间消耗) ,时间复杂度大部分情况是o(1)(如果实现中没有循环就是 O(1),如果实现中有一个循环就是 O(n))
多路 I/O 复用技术:
redis基于socket进行通信,服务端接收多个连接请求。
单线程是当服务器监听多个I/O时,一个I/O阻塞影响其他I/O,及一个io被阻塞时,其他io没法传输数据。
多路 I/O 复用技术的作用是在空闲的时候,会把当前线程阻塞掉,当有一个或多个流有I/O事件时,就从阻塞态中唤醒,io与io之间不会相互堵塞,程序就会轮询一遍所有的流,并且只依次顺序的处理就绪的流(及服务器接收到数据的流),这样可以节约大量数据传输的时间。
(1)单线程的好处
代码清晰,处理逻辑简单
不用考虑各种锁的问题,不存在死锁的情况
多线程处理会涉及到线程切换而消耗CPU
(2)单线程处理的缺点?
无法发挥多核CPU性能,不过可以通过在单机开多个Redis实例来完善
2、Redis不存在线程安全问题?
Redis采用了线程封闭的方式,把任务封闭在一个线程,自然避免了线程安全问题,不过对于需要依赖多个redis操作的复合操作来说,依然需要锁,而且有可能是分布式锁
redis持久化的两种方式:
(1)rdb(redis database)-- 快照持久化
redis将某一时间点的数据全部打包生成一个.rdb的文件,保存在磁盘中,当我们重启redis服务的时候,将会读取该rdb文件恢复数据库中的数 据。并在启动时自动加载rdb文件,恢复之前保存的数据,默认开启
save [seconds] [changes]
save 60 100(每60秒检查一次数据,如果发生100及以上的数据变更,则进行RDB快照保存)
优点:对性能影响小,不怎么影响redis处理客户端请求
恢复速度比aof要快
缺点:快照是定期生成的,在redis崩溃的时候或多或少会损失点数据
如果cpu是单核,那么redisfork子进程保存rdb时耗时会变长,影响redis对外服务的能力
(2)aof(append only file ) -- 只追加文件持久化:
Redis会把每一个写请求都记录在一个日志文件里。在Redis重启时,会把AOF文件中记录的所有写操作顺序执行一遍,确保数据恢复到最 新。AOF默认是关闭的
三种配置方式:appendfsync no:不进行fsync,将flush文件的时机交给OS决定,速度最快
appendfsync always:每写入一条日志就进行一次fsync操作,数据安全性最高,但速度最慢
appendfsync everysec:折中的做法,交由后台线程每秒fsync一次
AOF rewrite功能:因为所有操作都会记录日志,会记录很多无用操作,文件过大,此功能能恢复日志到最新状态的最小写操作集
优点:使用always配置,最多损失一秒钟内的内容
不过大多数应用场景下,建议至少开启RDB方式的数据持久化