【架构学习(三)】高性能存储设计流程


前言

在这里插入图片描述

作为后端开发应该对整体系统架构有一定了解。所以需要学习有关软件系统架构知识。我采用读书的方式去了解整体软件系统架构,所读书名《从零开始学架构》。
学习目标:
1.架构设计目的及复杂度来源
2.架构设计流程
3.高性能架构
4.CAP理论和FMEA方法
5.高可用架构
6.可扩展架构
7.微服务架构最佳实践
8.互联网架构技术

写此博客的目的:
1.完成学习目标
2.对书中内容进行总结,得到自己的阅读心得
3.方便其他入门小伙伴快速得到干货
4.方便自己回顾架构知识

前几期帖子:
【架构学习(一)】架构设计目的及复杂度来源
【架构学习(二)】架构设计流程


一、高性能DB集群

读写分离

什么是高性能数据库集群两大特点?
读写分离”,分散存储压力;
分库分表”,分散访问压力和和存储压力。

什么是读写分离适用场景呢?
适用场景:读多写少,举例:消息记录业务,比如微博评论。
不适合场景:及时性高的业务,比如登录注册(及时性和准确性高的业务可以采用直接读主库,准确性不高可以引入缓存设计)。

读写分离的基本实现?
数据库服务器搭建主从集群,一主一从、一主多从都可以。
1)数据库主机负责读写操作,从机只负责读操作。
2)数据库主机通过复制将数据同步到从机,每台数据库服务器都存储了所有的业务数据。
3)业务服务器将写操作发给数据库主机,将读操作发给数据库从机。

读写分离,既然分散了读写压力,那这种设计的复杂度体现在?
复制延迟
主从复制延迟可能达到1秒,如果有大量数据同步,延迟1分钟也是有可能的。主从复制延迟会带来一个问题:如果业务服务器将数据写入到数据库主服务器后立刻(1秒内)进行读取,此时读操作访问的是从机,主机还没有将数据复制过来,到从机读取数据是读不到最新数据的,业务上就可能出现问题。这可能有些实时业务场景要求读主库。

如何解决复制延迟问题?
解决主从复制延迟有几种常见的方法:
1.读从机失败后再读一次主机
这就是通常所说的“二次读取”,二次读取和业务无绑定,只需要对底层数据库访问的API进行封装即可,实现代价较小,不足之处在于如果有很多二次读取,将大大增加主机的读操作压力。例如,黑客暴力破解账号,会导致大量的二次读取操作,主机可能顶不住读操作的压力从而崩溃。
2.关键业务读写操作全部指向主机,非关键业务采用读写分离
例如,对于一个用户管理系统来说,注册+登录的业务读写操作全部访问主机,用户的介绍、爱好、等级等业务,可以采用读写分离,因为即使用户改了自己的自我介绍,在查询时却看到了自我介绍还是旧的,业务影响与不能登录相比就小很多,还可以忍受。

分配机制
将读写操作区分开来,然后访问不同的数据库服务器,一般有两种方式:程序代码封装和中间件封装。
1.程序代码封装
程序代码封装指在代码中抽象一个数据访问层,实现读写操作分离和数据库服务器连接的管理。个人理解就是在程序与mysql交互的时候,是通过代码(较为底层方法操作jdbc)编写。
在这里插入图片描述
2.中间件封装
中间件封装指的是独立一套系统出来,实现读写操作分离和数据库服务器连接的管理。中间件对业务服务器提供SQL兼容的协议,业务服务器无须自己进行读写分离。对于业务服务器来说,访问中间件和访问数据库没有区别,事实上在业务服务器看来,中间件就是一个数据库服务器。(万事不觉就加一层)
在这里插入图片描述

举例:
订餐系统,在高峰时期,操作数据库很频繁。但当前mysql只有一台,用户需要去下单订餐,而后台管理人员也需要看当前系统的事实情况。出现磁盘IO报警问题。
需求分析:
需要解决磁盘IO报警,应对未来预期的业务需求增长。
解决方法:
读写分离,用户侧全部读写采用主库,后台管理人员写走走主库,读走从库。

分库分表

分库分表分散存储压力
主要体现在这几个方面:
数据量太大,读写的性能会下降,即使有索引,索引也会变得很大,性能同样会下降。
数据文件会变得很大,数据库备份和恢复需要耗费很长时间。
数据文件越大,极端情况下丢失数据的风险越高。(这也是为什么要求数据库为什么会有几千万归档)

单台服务器性能怎么样?
单台mysql服务器能够支撑10w用户量级查询,当单台mysql服务带到60%承载能力就需要考虑分库(正常mysql cpu到40%就会报警)

分库分表的总体思路是什么样的?
空间-》时间
单表-》多表同库-》分库

业务分库
业务分库指的是按照业务模块将数据分散到不同的数据库服务器。
1.join查询问题,跨库不能使用join查询
2.事务问题,同库不同表可以使用事务,分布式事务性能低不推荐使用
3.成本问题,增加机器

分表方案
单表数据拆分有两种方式:垂直分表和水平分表。
为了形象地理解垂直拆分和水平拆分的区别,可以想象你手里拿着一把刀,面对一个蛋糕切一刀:
1)从上往下切就是垂直切分,因为刀的运行轨迹与蛋糕是垂直的,这样可以把蛋糕切成高度相等(面积可以相等也可以不相等)的两部分,对应到表的切分就是表记录数相同但包含不同的列。
2)从左往右切就是水平切分,因为刀的运行轨迹与蛋糕是平行的,这样可以把蛋糕切成面积相等(高度可以相等也可以不相等)的两部分,对应到表的切分就是表的列相同但包含不同的行数据。

在这里插入图片描述
1.垂直分表
垂直分表适合将表中某些不常用且占了大量空间的列拆分出去。
垂直分表引入的复杂性主要体现在表操作的数量要增加。例如,原来只要一次查询就可以获取的字段,现在需要两次查询。

2.水平分表
水平分表相比垂直分表,会引入更多的复杂性,主要表现在下面几个方面:
1)范围路由:选取有序的数据列(例如,整形、时间戳等)作为路由的条件,不同分段分散到不同的数据库表中。以最常见的用户ID为例,路由算法可以按照1000000的范围大小进行分段.范围路由的缺点就是数据分配不均。

2)Hash路由:选取某个列(或者某几个列组合也可以)的值进行Hash运算,然后根据Hash结果分散到不同的数据库表中。同样以用户ID为例,假如我们一开始就规划了10个数据库表,路由算法可以简单地用user_id % 10的值来表示数据所属的数据库表编号,ID为985的用户放到编号为5的子表中,ID为10086的用户放到编号为6的字表中
hash路由的缺点就是增加新的表数据需要重新分配(存在数据迁移问题,头大了)

3)配置路由:配置路由就是路由表,用一张独立的表来记录路由信息。同样以用户ID为例,我们新增一张user_router表,这个表包含user_id和 table_id 两列,根据user_id就可以查询对应的 table_id。
配置路由的缺点就是必须多查询一次,会影响整体性能。

4)join 操作
水平分表后,数据分散在多个表中,如果需要与其他表进行join查询需要在业务代码或者数居库中间件中进行多次join查询,然后将结果合并。

5)count()操作
count()相加:具体做法是在业务代码或者数据库中间件中对每个表进行count()操作,然后将结果相加。这种方式实现简单,缺点就是性能比较低。例如,水平分表后切分为20张表,则要进行20次count(*)操作,如果串行的话,可能需要几秒钟才能得到结果。
记录数表︰具体做法是新建一张表,假如表名为“记录数表”,包含table_name、row_count两个字段,每次插入或者删除子表数据成功后,都更新“记录数表”,但需要每次更新业务表的同时更新记录表对数据库有压力。

6)order by 操作
水平分表后,数据分散到多个子表中,排序操作无法在数据库中完成只能由业务代码或者数据库中间件分别查询每个子表中的数据,然后汇总进行排序。(这点我想到了es)


二、NoSQL

nosql解决的是sql以下问题
1)关系数据库存储的是行记录,无法存储数据结构。
2)关系数据库的schema扩展很不方便,比如操作不存在列会报错,扩展需要ddl。
3)关系数据库的全文搜索功能比较弱,like扫表性能非常低(感觉这条才是需要nosql的核心)。

常见的NoSQL方案分为4类。
1)K-V存储:解决关系数据库无法存储数据结构的问题,以 Redis为代表。
2)文档数据库:解决关系数据库强schema约束的问题,以MongoDB为代表。
3)列式数据库:解决关系数据库大数据场景下的I/O问题,以 HBase为代表。
4)全文搜索引擎:解决关系数据库的全文搜索性能问题,以Elasticsearch为代表。

K-V存储
K-V存储的全称是Key-Value存储,其中Key是数据的标识,和关系数据库中的主键含义一样,Value 就是具体的数据。
Redis是K-V存储的典型代表,它是一款开源(基于BSD许可)的高性能K-V缓存和存储系统。Redis的 Value是具体的数据结构,包括string、hash、list、set、sorted set、bitmap和hyperloglog,所以常常被称为数据结构服务器。
Redis的缺点主要体现在并不支持完整的ACID事务,Redis虽然提供事务功能,但Redis的事务和关系数据库的事务不可同日而语,RedliS的事务不能保证原子性和持久性(A和D)(可以理解redis的事务就是一个脚本,当命令执行失败了,其他命令会继续执行)。

文档数据库
为了解决关系数据库schema带来的问题,文档数据库应运而生。文档数据库最大的特点就是no-schema,可以存储和读取任意的数据。目前绝大部分文档数据库存储的数据格式是JSON(或者BSON),因为JSON数据是自描述的,无须在使用前定义字段,读取一个JSON中不存在的字段也不会导致SQL那样的语法错误。
1.新增字段简单
业务上增加新的字段,无须再像关系数据库一样要先执行DDL语句修改表结构,程序代码直接读写即可。
2.历史数据不会出错
对于历史数据,即使没有新增的字段,也不会导致错误,只会返回空值。
文档数据库no-schema的特性带来的这些优势也是有代价的,最主要的代价就是不支持事务,无法实现关系数据库的join操作。

列式数据库
列式数据库就是按照列来存储数据的数据库,与之对应的传统关系数据库被称为“行式数据库”,因为关系数据库是按照行来存储数据的。
关系数据库按照行式来存储数据,主要有以下几个优势:
业务同时读取多个列时效率高,因为这些列都是按行存储在一起的,一次磁盘操作就能够把一行数据中的各个列都读取到内存中。
能够一次性完成对一行中的多个列的写操作,保证了针对行数据写操作的原子性和一致性;否则如果采用列存储,可能会出现某次写操作,有的列成功了,有的列失败了,导致数据不一致。

全文搜索引擎
传统的关系型数据库通过索引来达到快速查询的目的,但是在全文搜索的业务场景下,索引也无能为力,主要体现在:
1)全文搜索的条件可以随意排列组合,如果通过索引来满足,则索引的数量会非常多。
2)全文搜索的模糊匹配方式,索引无法满足,只能用like查询,而like查询是整表扫描,效率非常低。
在这里插入图片描述

1.全文搜索基本原理(就是es的原理)
全文搜索引擎的技术原理被称为“倒排索引”(Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,其基本原理是建立单词到文档的索引。之所以被称为“倒排”索引,是和“正排“索引相对的,“正排索引”的基本原理是建立文档到单词的索引。我们通过一个简单的样例来说明这两种索引的差异。
2.全文搜索的使用方式
全文搜索引擎的索引对象是单词和文档,而关系数据库的索引对象是键和行,两者的术语差异很大,不能简单地等同起来。因此,为了让全文搜索引擎支持关系型数据的全文搜索,需要做一些转换操作,即将关系型数据转换为文档数据。
目前常用的转换方式是将关系型数据按照对象的形式转换为JSON文档,然后将JSON文档输入全文搜索引擎进行索引。我同样以程序员的基本信息表为例,看看如何转换。

总结
业务存储用db,减少db压力用redis,快速搜索用es


三、高性能缓存架构

在这里插入图片描述

缓存穿透

缓存穿透是指缓存没有发挥作用,业务系统虽然去缓存查询数据,但缓存中没有数据,业务系统需要再次去存储系统查询数据。通常情况下有两种情况:
1.存储数据不存在
第一种情况是被访问的数据确实不存在。一般情况下,如果存储系统中没有某个数据,则不会在缓存中存储相应的数据,这样就导致用户查询的时候,在缓存中找不到对应的数据,每次都要去存储系统中再查询一遍,然后返回数据不存在。缓存在这个场景中并没有起到分担存储系统访问压力的作用。
通常情况下,业务上读取不存在的数据的请求量并不会太大,但如果出现一些异常情况,例如被黑客攻击,故意大量访问某些读取不存在数据的业务,有可能会将存储系统拖垮。
这种情况的解决办法比较简单,如果查询存储系统的数据没有找到,则直接设置一个默认值(可以是空值,也可以是具体的值)存到缓存中,这样第二次读取缓存时就会获取到默认值,而不会继续访问存储系统。
(这里其实查询这种还是没法设置默认值,理解这回导致缓存和db的不一致。理解恶意攻击数据库也是通过接口来攻击的,最好还是有人恶意攻击数据库的时候,我们应该关注接口,qps等指标和mysql指标,做好降级限流操作)
2.缓存数据生成耗费大量时间或者资源
第二种情况是存储系统中存在数据,但生成缓存数据需要耗费较长时间或者耗费大量资源。如果刚好在业务访问的时候缓存失效了,那么也会出现缓存没有发挥作用,访问压力全部集中在存储系统上的情况。

缓存雪崩

缓存雪崩是指当缓存失效(过期)后引起系统性能急剧下降的情况。当缓存过期被清除后,业务系统需要重新生成缓存,因此需要再次访问存储系统,再次进行运算,这个处理步骤耗时几十毫秒甚至上百毫秒。而对于一个高并发的业务系统来说,几百毫秒内可能会接到几百上千个请求。由于旧的缓存已经被清除,新的缓存还未生成,造成巨大的性能压力。这些压力又会拖慢整个系统,严重的会造成数据库宕机,从而形成一系列连锁反应,造成整个系统崩溃。
缓存雪崩的常见解决方法有两种:更新锁机制和后台更新机制。
1.更新锁
必须需要分布式锁来控制更新,因为多台机器还是有可能同时更新缓存。
2.后台更新
由后台线程来更新缓存,而不是由业务线程来更新缓存,缓存本身的有效期设置为永久,后台线程定时更新缓存。(通过job或者mq去操作)
后台定时机制需要考虑一种特殊的场景,当缓存系统内存不够时,会“踢掉”一些缓存数据,从
缓存被“踢掉”到下一次定时更新缓存的这段时间内,业务线程读取缓存返回空值,而业务线程本身又不会去更新缓存,因此业务上看到的现象就是数据丢了。解决的方式有两种:
1)后台线程除了定时更新缓存,还要频繁地去读取缓存(例如,1秒或者100毫秒读取一次),如果发现缓存被“踢了”就立刻更新缓存,这种方式实现简单,但读取时间间隔不能设置太长,因为如果缓存被踢了,缓存读取间隔时间又太长,这段时间内业务访问都拿不到真正的数据而是一个空的缓存值,用户体验一般。
2)业务线程发现缓存失效后,通过消息队列发送一条消息通知后台线程更新缓存。可能会出现多个业务线程都发送了缓存更新消息,但其实对后台线程没有影响,后台线程收到消息后更新缓存前可以判断缓存是否存在,存在就不执行更新操作。这种方式实现依赖消息队列,复杂度会高一些,但缓存更新更及时,用户体验更好。(这种思路牛)

缓存热点

虽然缓存系统本身的性能比较高,但对于一些特别热点的数据,如果大部分甚至所有的业务请求都请求同一个key,会出现性能下降问题。
1)锁竞争
某些数据结构访问时会加锁
2)内存访问
当大部分请求都集中在少数几个key上时,这些key的数据可能会频繁地在CPU缓存和主内存之间移动,这会导致缓存未命中率增加,进而降低Redis的性能。(这里指的缓存未命中值得是linux机器的l1,l2,l3缓存,与redis进行交互,因为热点key并不连续,造成cpu缓存利用率低)
缓存热点的解决方案就是复制多份缓存副本,将请求分散到多个缓存服务器上,减轻缓存热点导致的单台缓存服务器压力。(我理解就是将一个key,变为多个key,在key后面做编号,通过简单的%或者hash去匹配)
缓存热点问题写的好的帖子:https://zhuanlan.zhihu.com/p/696632931


总结

存储这块的复杂度优化都是围绕着db来做的,当请求量上升先对db进行优化,优化方案有读写分离,分库分表。当db不满足业务需求需要对热点数据快速访问可采用缓存机制,但增加复杂度的同时也需要注意缓存热点,穿透,击穿以及雪崩问题。当出现大量模糊查询时,我们也可以采用全文搜索数据库去配合db搜索。在db优化中可以看出多出使用了消息中间件,定时任务等保证业务的可用连贯性。


我的目标

希望在年底学习一下内容:
java学习内容:
1.tomcat源码
2.dubbo源码
3.zookeeper源码
4.netty源码
go学习内容:
1.gin框架学习
2.简单go项目
3.go基础知识进阶(gmp,gc,channel,map,slice源码等)
中间件学习内容:
1.kafka使用及源码
框架学习内容:
1.从零开始学架构
算法学习内容:
1.复习leetcode中top 100

我平时喜欢没事还打游戏,因为有宝宝所以希望在平时时间能尽量完成上述学习内容(希望能戒掉游戏哈哈哈)。
也希望有和我一样的一起学习的小伙伴共同学习进步,我建一个qq后端交流群:279868576,希望小伙伴们加入共同督促进步。

  • 13
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
推荐,资料太大存放在网盘中,需要可下载观看。含教材。 第一部分 考试简介 1.1 考试大纲要求 1.2 考试科目介绍 第二部分 信息系统基础 2.1 信息系统工程总体规划 2.2 政府信息化与电子政务 2.3 企业信息化与电子商务 2.4 信息资源管理 2.5 信息化的标准、法律和规定 第部分 系统开始基础 3.1 系统规划 3.2 软件开发方法 3.3 需求工程 3.4 软件系统建模 3.5 系统设计 3.6 测试与评审 3.7 软件开发环境与工具 3.8 系统运行与评价 第四部分 操作系统 4.1进程管理 4.2存储管理 4.3文件管理 4.4作业管理 4.5设备管理 第五部分 数据库系统 5.1数据库模式 5.2数据库完整性约束 5.3并发控制 5.4数据库设计 5.4.1数据库设计阶段 5.4.2ER模型 5.5数据库安全 5.6备份与恢复技术 5.7分布式数据库 5.8数据仓库 5.9数据挖掘 第六部分 计算机网络 6.1开放系统互连参考模型 6.2 TCP/IP协议族 6.3网络规划与设计 6.4计算机网络分类 6.5网络接入技术 6.6网络存储技术 6.7虚拟局域网(VLAN) 第七部分 软件架构设计 7.1 软件架构的概念 7.2 软件架构风格 7.3 面向服务的架构 7.4 特定领域软件架构 7.5 基于架构的软件开发方法 7.6 软件架构评估 7.7 软件产品线 第八部分 基于构件的开发 8.1 中间件技术 8.1.1 中间件的概念 8.1.2 主要的中间件 8.2 典型应用架构 8.3 企业应用集成 第九部分 应用数学 9.1 概率统计应用 9.2 图论应用 9.3 组合分析 9.4 算法的选择与应用 9.5 运筹方法 9.6 数学建模 第十部分 系统安全性与保密性设计 10.1安全与保密基础技术 10.2网络安全 10.3安全体系结构 10.3.1OSI安全模型 10.3.2MIS+S、S-MIS、S2-MIS 10.4安全审计 10.5安全策略 10.5.1核心 - 七定 10.5.2安全策略设计原则 第十一部分 系统配置与性能评价 11.1系统故障模型 11.2系统配置方法 11.3可靠性分析与可靠度计算 11.4性能评价方法 11.5软件容错 第十二部分 知识产权与标准化 12.1知识产权 12.1.1保护期限 12.1.2知识产权人确定 12.1.3侵权判断 12.1.4标准的分类 12.2标准化 12.2.1标准的分类 12.2.2标准类型的识别 第十部分 多媒体基础知识 13.1多媒体技术基本概念 13.1.1音频相关概念 13.1.2图像相关概念 13.1.3媒体的种类 13.2多媒体相关计算问题 13.2.1图像容量计算 13.2.2音频容量计算 13.2.3视频容量计算 13.3常见多媒体标准 13.4数据压缩技术 13.4.1数据压缩基础 13.4.2有损压缩与无损压缩 第十四部分 嵌入式系统 14.1 嵌入式系统的特点 14.2 嵌入式系统的基本架构 14.3 嵌入式系统网络 14.4 嵌入式系统数据库 14.5 实时任务调度和多任务设计 14.5.1 调度算法分类 14.5.2 单调执行速率调度法 14.5.3 时间轮转调度 14.5.4 最早截止时间优先调度算法 14.5.5 优先级反转 14.6 中断处理和异常处理 14.7 嵌入式系统开发设计 14.7.1 交叉开发环境 14.7.2 开发过程 14.7.3 调试方法 第十五部分 开发管理 15.1 范围管理 15.2 时间管理 15.3 成本管理 15.4 文档管理 15.4.1 软件文档管理指南 15.4.2 计算机软件文档编制规范 15.5 软件配置管理 15.6 软件质量管理 15.6.1 质量管理的概念 15.6.2 质量模型 15.6.3 质量管理过程 15.6.4 质量保证与质量控制 15.7 风险管理 15.8 软件过程改进 15.8.1 CMM 15.8.2 CMMI 15.8.3 ISO/IEC 15504 15.8.4 SJ/T 11234-2001 第十六部分 系统架构设计案例分析 16.1 考点分析 16.2 如何解答试题 16.3 试题解答实例 16.3.1 质量属性与软件架构策略 16.3.2 数据流图与流程图 16.3.3 嵌入式系统设计 16.3.4 软件架构风格的选择 16.3.4 信息系统安全设计 第十七部分 系统架构设计论文 17.1 考点分析 17.2 做好准备工作 17.3 论文写作格式 17.4 如何解答试题 17.5 如何写好摘要 17.6 如何写好正文 17.7 常见问题及解决办法 17.8 论文评分标
Java高并发高性能分布式框架从无到有微服务架构设计 微服务架构模式〔Microservice Architect Pattern〕.近两年在服务的疯狂增长与云计算技术的进步,让微服务架构受到重点关注 微服务架构是一种架构模式,它提倡将单一应用程序划分成一组小的服务,服务之间互相 协调、互相配合,为用户提供最终价值.每个服务运行在其独立的进程中,服务与服务间采 用轻量级的通信机制互相沟通〔通常是基于的RESTful API〕.每个服务都围绕着具体业务进行构建,并且能够被独立地部署到生产环境、类生产 环境等.另外,应尽量避免统一的、集中式的服务管理机制,对具体的一个服务而言,应根 据业务上下文,选择合适的语言、工具对其进行构建.微服务架构优势 首先简单介绍了微服务〔Microservices〕的内涵与优势,微服务架构的本质,是用一些功 能比较明确、业务比较精练的服务去解决更大、更实际的问题.微服务架构将服务拆分, 分别采用相对独立的服务对各方面进行管理,彼此之间使用统一的接口来进行交流,架构 变得复杂,优势也很明显: 复杂度可控:在将应用分解的同时,规避了原本复杂度无止境的积累.每一个微服务专注 于单一功能,并通过定义良好的接口清晰表述服务边界.由于体积小、复杂度低,每个微服 务可由一个小规模开发团队完全掌控,易于保持高可维护性和开发效率.什么是微服务架 构微服务架构优势 独立部署:由于微服务具备独立的运行进程,所以每个微服务也可以独立部署.当某个微 服务发生变更时无需编译、部署整个应用.由微服务组成的应用相当于具备一系列可并行 的发布流程,使得发布更加高效,同时降低对生产环境所造成的风险,最终缩短应用交付周 期. 技术选型灵活:微服务架构下,技术选型是去中心化的.每个团队可以根据自身服务的需 求和行业发展的现状,自由选择最适合的技术栈.由于每个微服务相对简单,当需要对技术 栈进行升级时所面临的风险较低,甚至完全重构一个微服务也是可行的. 容错:当某一组建发生故障时,在单一进程的传统架构下,故障很有可能在进程内扩散,形 成应用全局性的不可用.在微服务架构下,故障会被隔离在单个服务中.若设计良好,其他 服务可通过重试、平稳退化等机制实现应用层面的容错. 扩展:单块架构应用也可以实现横向扩展,就是将整个应用完整的复制到不同的节点.当 应用的不同组件在扩展需求上存在差异时,微服务架构便体现出其灵活性,因为每个服务 可以根据实际需求独立进行扩展.互联网高并发相关名词页面浏览数〔page views 〕唯一身份浏览量〔Unique PageViews〕独立访问者数量〔unique visitors〕重复访问者数量〔repeat visitors〕每个访问者的页面浏览数〔Page Views per user〕高并发之前我将高并发的解决方法误认为是线程或者是队列可以解决,因为高并发 的时候是有很多用户在访问,导致出现系统数据不正确、丢失数据现象,所以想到 的是用队列解决,其实队列解决的方式也可以处理,比如我们在竞拍商品、转发评论微博 或者是秒杀商品等,同一时间访问量特别大,队列在此起到特别的作用,将 所有请求放入队列,以毫秒计时单位,有序的进行,从而不会出现数据丢失系统数据不正确 的情况. 经过查资料,高并发的解决方法有俩种,一种是使用缓存、另一种是使用生成静态页面; 还有就是从最基础的地方优化我们写代码减少不必要的资源浪费:<1.不要频繁的new对 象,对于在整个应用中只需要存在一个实例的类使用单例模式.对于String的连接操作,使 用StringBuffer或者StringBuilder.对于utility类型的类通过静态方法来访问.2. 避免使用错误的方式,如Exception可以控制方法推出,但是Exception要保留stacktrace 消耗性能,除非必要不要使用 instanceof做条件判断,尽量使用比的条件判断方式.使用JAVA中效率高的类,比如Array List比Vector性能好.>高并发 - 需要解决的问题一:应用缓存二:缓存:多级缓存四:池化五:异步并发六:扩容七 :队列高并发-应用缓存堆缓存 使用Java堆内存来存储缓存对象.使用堆缓存的好处是没有序列化/反序列化,是最快的缓 存.缺点也很明显,当缓存的数据量很大时,GC〔垃圾回收〕暂停时间会变长,存储容量受 限于堆空间大小.一般通过软引用/弱引用来存储缓存对象,即当堆内存不足时,可以强制 回收这部分内存释放堆内存空间.一般使用堆缓存存储较热的数据.有Guava Cache: 缓存和ConcurrentMap是非常相像的,但是它们也不完全一样.最根本的区别就是,Concur rentMap会持有所有添加的对象,直到被显示的移除.而缓存为了限制其内存的使用,通
上百节课详细讲解,需要的小伙伴自行百度网盘下载,链接见附件,永久有效。 课程介绍: 讲解一个真实的、复杂的大型企业级亿级高并发项目,是java架构实战课程。 通过本套课程的学习,可以积累大量架构设计经验,迈入架构师行列。 课程特色: 1、完整的大型电商详情页系统架构:不再只是关注电商详情页架构中的缓存架构部分,而是关注全链路、全流程的完整架构,对完整的架构进行设计以及开发,包括了动态渲染系统、OneService系统、前端页面、大型工程运维四个部分。 2、基于更加完整的业务架构来讲解,从最源头的商品服务、价格服务、库存服务开始,从业务数据的变更到缓存数据的生产,将整个商品详情页系统架构串联起来。虽然上游服务的业务还是做了大幅度的简化,但是业务架构更加完整,能够让同学们站在更加完整的角度来学习和理解整个架构。 3、完整的微服务架构的项目实战:微服务完整的架构中,一定是包含了微服务建模/模型设计、基础技术架构、持续交付流水线、容器部署几个环节的,而市面上已有的微服务课程,几乎很少有完全涵盖这些环节的,更不用说微服务架构的实战了。课程中,将会讲解完整的微服务架构,包括基于Spring Cloud作为微服务架构的基础技术架构,基于DevOps思想与Jenkins构建持续交付流水线以及自动化测试套件,基于Docker作为容器部署和运行微服务。同时最有价值的地方在于,可以基于完全真实的亿级流量电商详情页系统的项目背景下,来实战这整套微服务架构,相当于是一个真实的微服务架构项目实战。 4、多机房部署架构下的4级缓存架构:大公司里真实的亿级流量高并发系统,都是采取了多个机房的部署架构,以实现高可用以及异地灾备。课程会重点讲解,在多机房部署架构下,如何设计和实现高并发系统的4级缓存架构。 5、复杂业务场景下的多层次消息队列架构:在复杂的业务场景下,需要设计多层次的消息队列架构,包括了去重队列、优先级队列、刷数据队列等多个层次的复杂架构设计与实现。 6、后台服务的多线程并发架构设计:对于后台运行的服务,需要采用多线程并发设计大幅度提升系统的资源利用率以及吞吐量。 7、Redis集群的批量数据查询性能优化:对于分布式的Redis集群,数据在多个实例中分布式存储,如果要优化大批量数据的批量查询性能,就需要采用hash tag分片路由+mget单分批大批量读取的优化设计。 8、高可用架构设计:整套大型系统如何实现高可用架构设计和部署?需要对整个读链路进行多级降级机制的设计,并且还需要进行基于Hystrix的依赖调用隔离 9、基础设施技术涵盖了大型系统中常用的各种技术,包括了:LVS+KeepAlived、Nginx+Lua、Twemproxy+SSDB+Redis(磁盘+内存的分布式与读写分离双KV集群)、RabbitMQ消息中间件 10、直接可以二次开发的代码:本次升级,采取了大型电商网站商品详情页系统完整的全链路架构,包括基础设施如何部署,以及整体代码架构,都是完全按照公司里来做的。虽然本次升级依然是专注于架构,而不是业务,基本还是没有包含什么业务,但是本次课程最后做完产出的架构和代码,都是可以直接拿到手,在架构里填充进你们自己的业务就可以进行二次开发的,工业价值非常高!同时强调一下,本课程不会提供电商业务代码的二次开发,因为本课程几乎不包含太多的电商业务代码,主要讲解架构,所谓的代码二次开发,是对架构代码进行二次开发,在架构中填入你们自己的业务!!! 11、大公司的OneService一站式入口服务:基于商品详情页依赖数十个服务的业务特点,深入讲解了如何设计与开发大公司中常见的一站式入口服务,代理后端数十个服务,作为统一入口,打造服务闭环。 12、大型电商网站的前端页面的核心业务逻辑:完整讲解了大型电商网站的前端页面如何与后端整套系统配合的业务逻辑,包括了动态渲染系统直接渲染首屏的商品基本信息,滚屏时Ajax异步加载分段存储的商品介绍,Ajax异步调用OenService系统来加载时效性要求很高的价格、库存等数据。 13、大型电商网站的工程运维实践:在大型系统中,一定是需要对整套工程的运维流程做良好的设计的,包括了线下压测、线上压测、灰度发布、高峰期限流。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值