1. 项目架构演变过程
随着互联网的发展,用户群体逐渐壮大,网站的流量成倍增长,常规的单体架构已无法满足请求压力暴增和业务的快速迭代,架构的变化势在必行。
1.1 单体架构
单体架构所有模块和功能都集中在一个项目中 ,部署时也是将项目所有功能部整体署到服务器中。如下图:
优点:
- 小项目开发快 成本低
- 架构简单
- 易于测试
- 易于部署
缺点:
- 大项目模块耦合严重 不易开发 维护 沟通成本高
- 新增业务困难
- 核心业务与边缘业务混合在一块,出现问题互相影响
1.2 垂直架构
根据业务把项目垂直切割成多个项目,因此这种架构称之为垂直架构。
为了避免上面提到的那些问题,我们开始做模块的垂直划分,做垂直划分的原则是基于拉勾的业务特性,核心目标,第一个是为了业务之间互不影响,第二个是在研发团队的壮大后为了提高效率,减少之间的依赖。
优点:
- 系统拆分实现了流量分担,解决了并发问题
- 可以针对不同系统进行优化
- 方便水平扩展,负载均衡,容错率提高
- 系统间相互独立,互不影响,新的业务迭代时更加高效
缺点:
- 系统之间接口调用硬编码
- 搭建集群之后,实现负载均衡比较复杂
- 服务系统接口调用监控不到位 调用方式不统一
- 服务监控不到位
- 数据库资源浪费,充斥慢查询,主从同步延迟大
1.3 分布式架构(SOA )
SOA全称为Service Oriented Architecture,即面向服务的架构 。它是在垂直划分的基础上,将每个项目拆分出多个具备松耦合的服务,一个服务通常以独立的形式存在于操作系统进程中。各个服务之间通过网络调用,这使得构建在各种各样的系统中的服务可以 以一种统一和通用的方式进行交互。
我们在做了垂直划分以后,模块随之增多,系统之间的RPC逐渐增多,维护的成本也越来越高,一些通用的业务和模块重复的也越来越多,这个时候上面提到的接口协议不统一、服务无法监控、服务的负载均衡等问题更加突出,为了解决上面的这些问题,我们将通用的业务逻辑下沉到服务层,通过接口暴露,供其他业务场景调用。
同时引入了阿里巴巴开源的Dubbo,一款高性能、轻量级的开源Java RPC框架,它提供了三大核心能力:面向接口的远程方法调用
,智能容错和负载均衡
,以及服务自动注册和发现
。
解释说明:
- 分层:按照业务性质分层 每一层要求简单 和 容易维护
- 应用层:距离用户最近的一层, 也称之为接入层。 使用tomcat 作为web容器, 接收用户请求, 使用下游的dubbo提供的接口来返回数据, 并且该层禁止访问数据库。
- 业务服务层:根据具体的业务场景 演变而来的模块, 比如 简历投递 职位搜索 职位推荐等
- 基础业务层:拉勾网招聘业务的核心 ,账号 、简历 、公司、 职位。
- 基础服务层:这一层 是与业务无关的模块, 是一些通用的服务。
这类服务的特点:请求量大, 逻辑简单, 特性明显, 功能独立。
比如:消息服务(发邮件 短信 微信),附件解析 50% 自己上传附件简历 需要解析成pdf- 存储层:不同的存储类型, Mysql、 Mongodb 、ES、 fastDFS。
- 分级:按照业务性质分层, 同一层的业务也要做好分级, 依据业务的重要性进行分级。 按照二八定律网站80%的流量 都在核心功能上面, 要优先保证核心业务的稳定。
- 隔离:不同性质 、不同重要性的业务做好隔离, 包括 业务、 缓存 DB 中间件 都要做好隔离。 比如: 核心业务的数据库, 要和活动相关的数据库隔离。
- 调用 :总体上调用要单向 ,可以跨层调用, 但不能出现逆向调用。
优点:
- 服务以接口为粒度,为开发者屏蔽远程调用底层细节 使用Dubbo 面向接口远程方法调用屏蔽了底层调用细节
- 业务分层以后架构更加清晰, 并且每个业务模块职责单一 扩展性更强
- 数据隔离,权限回收,数据访问都通过接口 让系统更加稳定 安全
- 服务应用本身无状态化 ,这里的无状态化指的是应用本身不做内存级缓存, 而是把数据存入db
- 服务责任易确定, 每个服务可以确定责任人, 这样更容易保证服务质量和稳定
缺点:
- 粒度控制复杂 如果没有控制好服务的粒度 服务的模块就会越来越多 就会引发 超时 分布式事务等问题
- 服务接口数量不宜控制 容易引发接口爆炸 所以服务接口建议以业务场景进行单位划分 并对相近的业务做抽象 防止接口爆炸
- 版本升级兼容困难 尽量不要删除方法 字段 枚举类型的新增字段也可能不兼容
- 调用链路长 服务质量不可监控 调用链路变长 下游抖动可能会影响到上游业务 最终形成连锁反应 服务质量不稳定 同时链路的变成使得服务质量的监控变得困难
1.4 微服务架构
微服务架构是一种将单个应用程序 作为一套小型服务开发的方法,每种应用程序都在其自己的进程中独立运行,并使用轻量级机制(通常是HTTP资源的API)进行通信。这些服务是围绕业务功能构建的,可以通过全自动部署机制进行独立部署。这些服务的集中化管理非常少,它们可以用不同的编程语言编写,并使用不同的数据存储技术。
微服务是在SOA上做的升华 , 粒度更加细致,微服务架构强调的一个重点是“业务需要彻底的组件化和服务化”。
2. Dubbo架构与实战
2.1 Dubbo 架构概述
- 什么是Dubbo?
Apache Dubbo是一款高性能的Java RPC框架。其前身是阿里巴巴公司开源的一个高性能、轻量级的开源Java RPC框架,可以和Spring框架无缝集成。 - dubbo 的特性
参考dubbo官网首页:dubbo官网 - Dubbo 的服务治理
服务治理(SOA governance),企业为了确保项目顺利完成而实施的过程,包括最佳实践、架构原则、治理规程、规律以及其他决定性的因素。服务治理指的是用来管理SOA的采用和实现的过程。
参考官网:
2.2 Dubbo 处理流程
调用关系说明:
- 虚线: 代表异步调用 实线代表同步访问
- 蓝色虚线: 是在启动时完成的功能
- 红色虚线: 是程序运行中执行的功能
调用流程:
- 服务提供者在服务容器启动时 向注册中心 注册自己提供的服务
- 服务消费者在启动时, 向注册中心订阅自己所需的服务
- 注册中心返回服务提供者地址列表给消费者, 如果有变更, 注册中心会基于长连接推送变更数据给消费者
- 服务消费者 从提供者地址列表中 基于软负载均衡算法, 选一台提供者进行调用, 如果调用失败, 则重新选择一台
- 服务提供者和消费者 在内存中的调用次数 和 调用时间 定时每分钟发送给监控中心
节点说明:
节点 | 角色名称 |
---|---|
Provider | 暴露服务的服务提供方 |
Consumer | 调用远程服务的服务消费方 |
Registry | 服务注册与发现的注册中心 |
Monitor | 统计服务的调用次数和调用时间的监控中心 |
Container | 服务运行容器 负责启动 加载 运行服务提供者 |
2.3 服务注册中心Zookeeper
通过前面的Dubbo架构图可以看到,Registry(服务注册中心)在其中起着至关重要的作用。Dubbo官方推荐使用Zookeeper作为服务注册中心。Zookeeper 是 Apache Hadoop 的子项目,作为 Dubbo 服务的注册中心,工业强度较高,可用于生产环境,并推荐使用 。
2.4 Dubbo开发实战
2.4.1 实战案例介绍
在Dubbo中所有的的服务调用都是基于接口去进行双方交互的。双方协定好Dubbo调用中的接口,提供者来提供实现类并且注册到注册中心上。
调用方则只需要引入该接口,并且同样注册到相同的注册中心上(消费者)。即可利用注册中心来实现集群感知功能,之后消费者即可对提供者进行调用。
我们所有的项目都是基于Maven去进行创建,这样相互在引用的时候只需要以依赖的形式进行展现就可以了。
并且这里我们会通过maven的父工程来统一依赖的版本。
程序实现分为以下几步骤:
- 建立maven工程 并且 创建API模块: 用于规范双方接口协定
- 提供provider模块,引入API模块,并且对其中的服务进行实现。将其注册到注册中心上,对外来统一提供服务。
- 提供consumer模块,引入API模块,并且引入与提供者相同的注册中心。再进行服务调用。
2.4.2 开发过程
-
接口协定
- 定义maven:
<groupId>com.lagou</groupId> <artifactId>service-api</artifactId> <version>1.0-SNAPSHOT</version>
- 定义接口,这里为了方便,只是写一个基本的方法。
public interface HelloService { String sayHello(String name); }
- 定义maven:
-
创建接口提供者
- 引入API模块。
<dependency> <groupId>com.lagou</groupId> <artifactId>service-api</artifactId> <version>${project.version}</version> </dependency>
- 引入Dubbo相关依赖,这里为了方便,使用注解方式。
<dependency> <groupId>org.apache.dubbo</groupId> <artifactId>dubbo</artifactId> </dependency> <dependency> <groupId>org.apache.dubbo</groupId> <artifactId>dubbo-registry-zookeeper</artifactId> </dependency> <dependency> <groupId>org.apache.dubbo</groupId> <artifactId>dubbo-rpc-dubbo</artifactId> </dependency> <dependency> <groupId>org.apache.dubbo</groupId> <artifactId>dubbo-remoting-netty4</artifactId> </dependency> <dependency> <groupId>org.apache.dubbo</groupId> <artifactId>dubbo-serialization-hessian2</artifactId> </dependency>
- 编写实现类。注意这里也使用了Dubbo中的 @Service 注解来声明他是一个服务的提供者。
@Service public class HelloServiceImpl implements HelloService { @Override public String sayHello(String name) { return "hello: " + name; } }
- 编写配置文件,用于配置dubbo。比如这里我就叫 dubbo-provider.properties ,放入到resources 目录下。
dubbo.application.name=dubbo-demo-annotation-provider dubbo.protocol.name=dubbo dubbo.protocol.port=20880
- dubbo.application.name:当前提供者的名称
- dubbo.protocol.name:对外提供的时候使用的协议
- dubbo.protocol.port:该服务对外暴露的端口是什么,在消费者使用时,则会使用这个端口并且使用指定的协议与提供者建立连接。
- 编写启动的 main 函数。这里面做的比较简单,主要要注意注解方式中的注册中心这里是使用的本机2181端口来作为注册中心。
public class DubboPureMain { public static void main(String[] args) throws Exception { AnnotationConfigApplicationContext context = new AnnotationConfigApplicationContext(ProviderConfiguration.class); context.start(); System.in.read(); } @Configuration @EnableDubbo(scanBasePackages = "com.lagou.service.impl") @PropertySource("classpath:/dubbo-provider.properties") static class ProviderConfiguration { @Bean public RegistryConfig registryConfig() { RegistryConfig registryConfig = new RegistryConfig(); registryConfig.setAddress("zookeeper://127.0.0.1:2181"); return registryConfig; } } }
- 引入API模块。
-
创建接口消费者
- 引入API模块。
<dependency> <groupId>com.lagou</groupId> <artifactId>service-api</artifactId> <version>${project.version}</version> </dependency>
- 引入Dubbo依赖 ,同服务提供者。
- 编写服务,用于真实的引用dubbo接口并使用。因为这里是示例,所以比较简单一些。这里面@Reference 中所指向的就是真实的第三方服务接口。
@Component public class ConsumerComponent { @Reference private HelloService helloService; public String sayHello(String name) { return helloService.sayHello(name); } }
- 编写消费者的配置文件。这里比较简单,主要就是指定了当前消费者的名称和注册中心的位置。通过这个注册中心地址,消费者就会注册到这里并且也可以根据这个注册中心找到真正的提供者列表。
dubbo.application.name=service-consumer dubbo.registry.address=zookeeper://127.0.0.1:2181
- 编写启动类,这其中就会当用户在控制台输入了一次换行后,则会发起一次请求。
public class AnnotationConsumerMain { public static void main(String[] args) throws IOException, InterruptedException { AnnotationConfigApplicationContext context = new AnnotationConfigApplicationContext(ConsumerConfiguration.class); context.start(); ConsumerComponent service = context.getBean(ConsumerComponent.class); while (true) { System.in.read(); try { String hello = service.sayHello("world"); System.out.println("result :" + hello); } catch (Exception e) { e.printStackTrace(); } } } @Configuration @EnableDubbo(scanBasePackages = "com.lagou.service") @PropertySource("classpath:/dubbo-consumer.properties") @ComponentScan(value = {"com.lagou.bean.consumer"}) static class ConsumerConfiguration { } }
- 引入API模块。
2.4.3 配置方式介绍
下面我们来使用不同的方式来对Dubbo进行配置。每种配置方式各有不同,一般可以分为以下几个。
- 注解:基于注解可以快速的将程序配置,无需多余的配置信息,包含提供者和消费者。但是这种方式有一个弊端,有些时候配置信息并不是特别好找,无法快速定位。
- XML:一般这种方式我们会和Spring做结合,相关的Service和Reference均使用Spring集成后的。通过这样的方式可以很方便的通过几个文件进行管理整个集群配置。可以快速定位也可以快速更改。
- 基于代码方式:基于代码方式的对上述配置进行配置。这个使用的比较少,这种方式更适用于自己公司对其框架与Dubbo做深度集成时才会使用。
2.5 Dubbo管理控制台 dubbo-admin
2.5.1 作用
主要包含:服务管理 、 路由规则、动态配置、服务降级、访问控制、权重调整、负载均衡等管理功能。
如我们在开发时,需要知道Zookeeper注册中心都注册了哪些服务,有哪些消费者来消费这些服务。我们可以通过部署一个管理中心来实现。其实管理中心就是一个web应用,原来是war(2.6版本以前)包需要部署到tomcat即可。现在是jar包可以直接通过java命令运行。
2.5.2 控制台安装步骤
1. 从git 上下载项目 https://github.com/apache/dubbo-admin
2. 修改项目下的dubbo.properties文件
注意dubbo.registry.address对应的值需要对应当前使用的Zookeeper的ip地址和端口号
• dubbo.registry.address=zookeeper://zk所在机器ip:zk端口
• dubbo.admin.root.password=root
• dubbo.admin.guest.password=guest
3.切换到项目所在的路径 使用mvn 打包
mvn clean package -Dmaven.test.skip=true
4.java 命令运行
java -jar 对应的jar包
2.5.3 使用控制台
1.访问http://IP:端口
2.输入用户名root,密码root
3.点击菜单查看服务提供者和服务消费者信息
2.6 Dubbo配置项说明
2.6.1 dubbo:application
对应 org.apache.dubbo.config.ApplicationConfig,代表当前应用的信息:
- name: 当前应用程序的名称,在dubbo-admin中我们也可以看到,这个代表这个应用名称。我们在真正时是时也会根据这个参数来进行聚合应用请求。
- owner: 当前应用程序的负责人,可以通过这个负责人找到其相关的应用列表,用于快速定位到责任人。
- qosEnable : 是否启动QoS 默认true
- qosPort : 启动QoS绑定的端口 默认22222
- qosAcceptForeignIp: 是否允许远程访问 默认是false
2.6.2 dubbo:registry
org.apache.dubbo.config.RegistryConfig,代表该模块所使用的注册中心。一个模块中的服务可以将其注册到多个注册中心上,也可以注册到一个上。后面再service和reference也会引入这个注册中心。
- id : 当当前服务中provider或者consumer中存在多个注册中心时,则使用需要增加该配置。在一些公司,会通过业务线的不同选择不同的注册中心,所以一般都会配置该值。
- address : 当前注册中心的访问地址。
- protocol : 当前注册中心所使用的协议是什么。也可以直接在 address 中写入,比如使用zookeeper,就可以写成 zookeeper://xx.xx.xx.xx:2181
- timeout : 当与注册中心不再同一个机房时,大多会把该参数延长。
2.6.3 dubbo:protocol
org.apache.dubbo.config.ProtocolConfig,指定服务在进行数据传输所使用的协议。
- id : 在大公司,可能因为各个部门技术栈不同,所以可能会选择使用不同的协议进行交互。这里在多个协议使用时,需要指定。
- name : 指定协议名称。默认使用 dubbo 。
2.6.4 dubbo:reference
org.apache.dubbo.config.ReferenceConfig,消费者的配置,这里只做简单说明,后面会具体讲解。
- id : 指定该Bean在注册到Spring中的id。
- interface: 服务接口名
- version : 指定当前服务版本,与服务提供者的版本一致。
- registry : 指定所具体使用的注册中心地址。这里面也就是使用上面在 dubbo:registry 中所声明的id。
2.6.5 dubbo:service
org.apache.dubbo.config.ServiceConfig,用于指定当前需要对外暴露的服务信息,后面也会具体讲解。和 dubbo:reference 大致相同。
- interface : 指定当前需要进行对外暴露的接口是什么。
- ref : 具体实现对象的引用,一般我们在生产级别都是使用Spring去进行Bean托管的,所以这里面一般也指的是Spring中的BeanId。
- version : 对外暴露的版本号。不同的版本号,消费者在消费的时候只会根据固定的版本号进行消费。
2.6.6 dubbo:method
org.apache.dubbo.config.MethodConfig,用于在制定的 dubbo:service 或者 dubbo:reference 中的更具体一个层级,指定具体方法级别在进行RPC操作时候的配置,可以理解为对这上面层级中的配置针对于具体方法的特殊处理。
- name : 指定方法名称,用于对这个方法名称的RPC调用进行特殊配置。
- async: 是否异步 默认false
2.6.7 dubbo:service和dubbo:reference详解
这两个在dubbo中是我们最为常用的部分,其中有一些我们必然会接触到的属性。并且这里会讲到一些设置上的使用方案。
- mock:用于在方法调用出现错误时,当做服务降级来统一对外返回结果,后面我们也会对这个方法做更多的介绍。
- timeout:用于指定当前方法或者接口中所有方法的超时时间。我们一般都会根据提供者的时长来具体规定。比如我们在进行第三方服务依赖时可能会对接口的时长做放宽,防止第三方服务不稳定导致服务受损。
- check:用于在启动时,检查生产者是否有该服务。我们一般都会将这个值设置为false,不让其进行检查。因为如果出现模块之间循环引用的话,那么则可能会出现相互依赖,都进行check的话,那么这两个服务永远也启动不起来。
- retries:用于指定当前服务在执行时出现错误或者超时时的重试机制。
a. 注意提供者是否有幂等,否则可能出现数据一致性问题
b. 注意提供者是否有类似缓存机制,如出现大面积错误时,可能因为不停重试导致雪崩- executes:用于在提供者做配置,来确保最大的并行度。
a. 可能导致集群功能无法充分利用或者堵塞
b. 但是也可以启动部分对应用的保护功能
c. 可以不做配置,结合后面的熔断限流使用
3. Dubbo高级实战
3.1 SPI
3.1.1 SPI简介
SPI 全称为 (Service Provider Interface) ,是JDK内置的一种服务提供发现机制。 目前有不少框架用它来做服务的扩展发现,简单来说,它就是一种动态替换发现的机制。使用SPI机制的优势是实现解耦,使得第三方服务模块的装配控制逻辑与调用者的业务代码分离。
3.1.2 JDK中的SPI
Java中如果想要使用SPI功能,先提供标准服务接口,然后再提供相关接口实现和调用者。这样就可以通过SPI机制中约定好的信息进行查询相应的接口实现。
SPI遵循如下约定:
- 当服务提供者提供了接口的一种具体实现后,在META-INF/services目录下创建一个以“接口全限定名”为命名的文件,内容为实现类的全限定名;
- 接口实现类所在的jar包放在主程序的classpath中;
- 主程序通过java.util.ServiceLoader动态装载实现模块,它通过扫描META-INF/services目录下的配置文件找到实现类的全限定名,把类加载到JVM;
- SPI的实现类必须携带一个无参构造方法;
3.1.3 Dubbo中的SPI
dubbo中大量的使用了SPI来作为扩展点,通过实现同一接口的前提下,可以进行定制自己的实现类。比如比较常见的协议,负载均衡,都可以通过SPI的方式进行定制化,自己扩展。
Dubbo中已经存在所有已经实现好的扩展点。
下图中则是Dubbo中默认提供的负载均衡策略。
3.1.4 Dubbo中扩展点使用方式
我们使用三个项目来演示Dubbo中扩展点的使用方式,一个主项目main,一个服务接口项目api,一个
服务实现项目imp。
-
api项目创建
- 导入坐标 dubbo
<dependency> <groupId>org.apache.dubbo</groupId> <artifactId>dubbo</artifactId> <version>2.7.5</version> </dependency>
- 创建接口, 在接口上使用@SPI
@SPI public interface HelloService { String sayHello(); }
- 导入坐标 dubbo
-
impl项目创建
-
导入 api项目 的依赖
<dependency> <groupId>com.lagou</groupId> <artifactId>dubbo_spi_demo_api</artifactId> <version>1.0-SNAPSHOT</version> </dependency>
-
建立实现类,为了表达支持多个实现的目的,这里分别创建两个实现。分别为HumanHelloService 和 DogHelloService 。
public class HumanHelloService implements HelloService { public String sayHello() { return "hello human"; } } public class DogHelloService implements HelloService { public String sayHello() { return "hello dog"; } }
-
SPI进行声明操作,在 resources 目录下创建目录 META-INF/dubbo 目录,在目录下创建名称为com.lagou.dubbo.study.spi.demo.api.HelloService的文件,文件内部配置两个实现类名称和对应的全限定名:
human=com.lagou.service.impl.HumanHelloService dog=com.lagou.service.impl.DogHelloService
-
-
main项目创建
-
导入坐标 接口项目 和 实现类项目
<dependency> <groupId>com.lagou</groupId> <artifactId>dubbo_spi_demo_api</artifactId> <version>1.0-SNAPSHOT</version> </dependency> <dependency> <groupId>com.lagou</groupId> <artifactId>dubbo_spi_demo_impl</artifactId> <version>1.0-SNAPSHOT</version> </dependency>
-
创建DubboSpiMain
和原先调用的方式不太相同, dubbo 有对其进行自我重新实现 需要借助ExtensionLoader,创建新的运行项目。这里demo中的示例和java中的功能相同,查询出所有的已知实现,并且调用。public class DubboSpiMain { public static void main(String[] args) { ExtensionLoader<HelloService> extensionLoader = ExtensionLoader.getExtensionLoader(HelloService.class); // 遍历所有拓展点 META-INF.dubbo Set<String> extensions = extensionLoader.getSupportedExtensions(); for (String extension: extensions) { String result = extensionLoader.getExtension(extension).sayHello(); System.out.println(result); } } }
-
dubbo自己做SPI的目的
:
- JDK 标准的 SPI 会一次性实例化扩展点所有实现,如果有扩展实现初始化很耗时,但如果没用上也加载,会很浪费资源
- 如果有扩展点加载失败,则所有扩展点无法使用
- 提供了对扩展点包装的功能(
Adaptive
),并且还支持通过set的方式对其他的扩展点进行注入
3.1.5 Dubbo SPI中的Adaptive功能
Dubbo中的Adaptive功能,主要解决的问题是如何动态的选择具体的扩展点。通过getAdaptiveExtension 统一对指定接口对应的所有扩展点进行封装,通过URL的方式对扩展点来进行动态选择
。 (dubbo中所有的注册信息都是通过URL的形式进行处理的。)这里同样采用相同的方式进行实现。
在上述例子中的代码中做改动,具体如下:
-
创建接口
- api中的 HelloService 扩展如下方法, 与原先类似,在sayHello中增加 Adaptive 注解,并且在参数中提供URL参数.注意这里的URL参数的类为 org.apache.dubbo.common.URL。
// @SPI可以指定一个字符串参数,用于指明该SPI的默认实现。如@SPI("dog") 表示默认实现dog的方法 @SPI public interface HelloService { String sayHello(); @Adaptive String sayHello(URL url); }
- api中的 HelloService 扩展如下方法, 与原先类似,在sayHello中增加 Adaptive 注解,并且在参数中提供URL参数.注意这里的URL参数的类为 org.apache.dubbo.common.URL。
-
创建实现类
与上面Service实现类代码相似,只需增加URL形参即可public class HumanHelloService implements HelloService { public String sayHello() { return "hello human"; } // 增加该方法的实现 @Override public String sayHello(URL url) { return "hello human url"; } }
-
编写DubboAdaptiveMain
最后在获取的时候方式有所改变,需要传入URL参数,并且在参数中指定具体的实现类参数。public class DubboAdaptiveMain { public static void main(String[] args) { URL url = URL.valueOf("test://localhost/hello?hello.service=dog"); final HelloService adaptiveExtension = ExtensionLoader.getExtensionLoader(HelloService.class).getAdaptiveExtension(); adaptiveExtension.sayHello(url); } }
注意:
- 因为在这里只是临时测试,所以为了保证URL规范,前面的信息均为测试值即可,关键的点在于
hello.service 参数,这个参数的值指定的就是具体的实现方式。关于为什么叫hello.service 是因为这个接口的名称,其中后面的大写部分被dubbo自动转码为 . 分割。 - 通过 getAdaptiveExtension 来提供一个统一的类来对所有的扩展点提供支持(底层对所有的扩展点进行封装)。
- 调用时通过参数中增加 URL 对象来实现动态的扩展点使用。
- 如果URL没有提供该参数,则该方法会使用默认在 SPI 注解中声明的实现。即如果url为 test://localhost/hello,没有参数,则或默认调用@SPI上定义的默认实现方法。
在这种情况下,@SPI必须定义一个默认值,不然会报错
- 因为在这里只是临时测试,所以为了保证URL规范,前面的信息均为测试值即可,关键的点在于
3.1.6 Dubbo调用时拦截操作
与很多框架一样,Dubbo也存在拦截(过滤)机制,可以通过该机制在执行目标程序前后执行我们指定的代码。
Dubbo的Filter机制,是专门为服务提供方和服务消费方调用过程进行拦截设计的,每次远程方法执行,该拦截都会被执行。这样就为开发者提供了非常方便的扩展性,比如为dubbo接口实现ip白名单功能、监控功能 、日志记录等。
步骤如下:
-
实现 org.apache.dubbo.rpc.Filter 接口
import org.apache.dubbo.rpc.Filter; public class DubboInvokeFilter implements Filter { ... }
-
使用 org.apache.dubbo.common.extension.Activate 接口进行对类进行注册 通过group 可以
指定对生产端 消费端 的哪一方进行拦截,如:// 表示对 生成端 和 消费端 都进行拦截 @Activate(group = {CommonConstants.CONSUMER,CommonConstants.PROVIDER})
-
计算方法运行时间的代码实现
-
在 META-INF.dubbo 中新建 org.apache.dubbo.rpc.Filter 文件,并将当前类的全名写入
timeFilter=com.lagou.filter.DubboInvokeFilter
完整代码:
@Activate(group = {CommonConstants.CONSUMER,CommonConstants.PROVIDER})
public class DubboInvokeFilter implements Filter {
@Override
public Result invoke(Invoker<?> invoker, Invocation invocation) throws RpcException {
long startTime = System.currentTimeMillis();
try {
// 执行方法
return invoker.invoke(invocation);
} finally {
System.out.println("invoke time:"+(System.currentTimeMillis()-startTime) + "毫秒");
}
}
}
注意:一般类似于这样的功能都是单独开发依赖的,所以在使用方的项目中只需要引入依赖该模块,在调用接口时,该方法便会自动拦截
。
3.2 负载均衡策略
dubbo官网负载均衡策略详解:dubbo负载均衡
3.2.1 负载均衡基本配置
负载均衡(Load Balance), 其实就是将请求分摊到多个操作单元上进行执行,从而共同完成工作任务。
负载均衡策略主要用于客户端存在多个提供者时进行选择某个提供者。
在集群负载均衡时,Dubbo 提供了多种均衡策略(包括随机、轮询、最少活跃调用数、一致性Hash),缺省为random随机调用。
配置负载均衡策略,既可以在服务提供者一方配置,也可以在服务消费者一方配置,如下:
// 在服务消费者一方配置负载均衡策略
@Reference(check = false,loadbalance = "random")
// 在服务提供者一方配置负载均衡
@Service(loadbalance = "random")
public class HelloServiceImpl implements HelloService {
public String sayHello(String name) {
return "hello " + name;
}
}
3.2.2 自定义负载均衡器
负载均衡器在Dubbo中的SPI接口是 org.apache.dubbo.rpc.cluster.LoadBalance , 可以通过实现这个接口来实现自定义的负载均衡规则。
-
自定义负载均衡器
在上一节的案例基础上创建名称为dubbo-spi-loadbalance的Maven模块,并创建负载均衡器
OnlyFirstLoadbalancer。import org.apache.dubbo.rpc.cluster.LoadBalance; // 实现LoadBalance 接口 public class OnlyFirstLoadbalancer implements LoadBalance { @Override public <T> Invoker<T> select(List<Invoker<T>> list, URL url, Invocation invocation) throws RpcException { // 自定义负载均衡方法 ...... } }
-
配置负载均衡器
在dubbo-spi-loadbalance工程的 META-INF/dubbo 目录下新建
org.apache.dubbo.rpc.cluster.LoadBalance 文件,并将当前类的全名写入:onlyFirst=com.laogu.loadbalance.OnlyFirstLoadbalancer
-
在服务消费方指定自定义负载均衡器 onlyFirst
public class ConsumerComponent { // 引用自定义的负载均衡器 @Reference(loadbalance = "onlyFirst") private HelloService helloService; public String sayHello(String name) { return helloService.sayHello(name); } }
3.3 异步调用
Dubbo不只提供了堵塞式的的同步调用,同时提供了异步调用的方式。这种方式主要应用于提供者接口响应耗时明显,消费者端可以利用调用接口的时间去做一些其他的接口调用,利用 Future 模式来异步等待和获取结果即可。这种方式可以大大的提升消费者端的利用率。 目前这种方式可以通过XML的方式进行引入
。
3.3.1 异步调用实现
-
为了能够模拟等待,通过 int timeToWait参数,标明需要休眠多少毫秒后才会进行返回。
String sayHello(String name, int timeToWait);
-
接口实现 为了模拟调用耗时 可以让线程等待一段时间
-
在消费者端,配置异步调用 注意消费端默认超时时间1000毫秒 如果提供端耗时大于1000毫秒会出现超时,可以通过改变消费端的超时时间 ,通过timeout属性设置即可单位毫秒
<dubbo:reference id="helloService" interface="com.lagou.service.HelloService"> <dubbo:method name="sayHello" async="true" /> </dubbo:reference>
-
测试,我们休眠100毫秒,然后再去进行获取结果。方法在同步调用时的返回值是空,我们可以通过 RpcContext.getContext().getFuture() 来进行获取Future对象来进行后续的结果等待操作。
public class XMLConsumerMain { public static void main(String[] args) throws IOException, InterruptedException { // consumer.xml为配置异步的xml文件 ClassPathXmlApplicationContext app = new ClassPathXmlApplicationContext("consumer.xml"); HelloService service = app.getBean(HelloService.class); while (true) { System.in.read(); try { String hello = service.sayHello("world", 100); // 利用Future 模式来获取 Future<Object> future = RpcContext.getContext().getFuture(); System.out.println("result :" + hello); System.out.println("future result:"+future.get()); } catch (Exception e) { e.printStackTrace(); } } } }
3.3.2 异步调用特殊说明
需要特别说明的是,该方式的使用,请确保dubbo的版本在2.5.4及以后的版本使用。 原因在于在2.5.3及之前的版本使用的时候,会出现异步状态传递问题。
比如我们的服务调用关系是 A -> B -> C,这时候如果A向B发起了异步请求,在错误的版本时,B向C发起的请求也会连带的产生异步请求。这是因为在底层实现层面,他是通过 RPCContext 中的
attachment 实现的。在A向B发起异步请求时,会在 attachment 中增加一个异步标示字段来表明异步
等待结果。B在接受到A中的请求时,会通过该字段来判断是否是异步处理。但是由于值传递问题,B向C发起时同样会将该值进行传递,导致C误以为需要异步结果,导致返回空。这个问题在2.5.4及以后的版本进行了修正。
3.4 线程池
3.4.1 Dubbo已有线程池
dubbo在使用时,都是通过创建真实的业务线程池进行操作的。目前已知的线程池模型有两个和java中
的相互对应:
- fix:表示创建固定大小的线程池。也是Dubbo默认的使用方式,默认创建的执行线程数为200,并且是没有任何等待队列的。所以再极端的情况下可能会存在问题,比如某个操作大量执行时,可能存在堵塞的情况。后面也会讲相关的处理办法。
- cache:创建非固定大小的线程池,当线程不足时,会自动创建新的线程。但是使用这种的时候需要注意,如果突然有高TPS的请求过来,方法没有及时完成,则会造成大量的线程创建,对系统的CPU和负载都是压力,执行越多反而会拖慢整个系统。
3.4.2 自定义线程池
在真实的使用过程中可能会因为使用fix模式的线程池,导致具体某些业务场景因为线程池中的线程数量不足而产生错误,而很多业务研发是对这些无感知的,只有当出现错误的时候才会去查看告警或者通过客户反馈出现严重的问题才去查看,结果发现是线程池满了。
所以可以在创建线程池的时,通过某些手段对这个线程池进行监控,这样就可以进行及时的扩缩容机器或者告警。
下面的这个程序就是这样子的,会在创建线程池后进行对其监控,并且及时作出相应处理。
-
线程池实现, 这里主要是基于对 FixedThreadPool 中的实现做扩展出线程监控的部分
public class WatchingThreadPool extends FixedThreadPool implements Runnable { private static final Logger LOGGER = LoggerFactory.getLogger(WatchingThreadPool.class); private static final double ALARM_PERCENT = 0.90; private final Map<URL, ThreadPoolExecutor> THREAD_POOLS = new ConcurrentHashMap<>(); public WatchingThreadPool() { // 每隔3秒打印线程使用情况 Executors.newSingleThreadScheduledExecutor().scheduleWithFixedDelay(this, 1,3, TimeUnit.SECONDS); } @Override public Executor getExecutor(URL url) { // 从父类中创建线程池 final Executor executor = super.getExecutor(url); if (executor instanceof ThreadPoolExecutor) { THREAD_POOLS.put(url, ((ThreadPoolExecutor) executor)); } return executor; } @Override public void run() { // 遍历线程池,如果超出指定的部分,进行操作,比如接入公司的告警系统或者短信平台 for (Map.Entry<URL, ThreadPoolExecutor> entry : THREAD_POOLS.entrySet()){ final URL url = entry.getKey(); final ThreadPoolExecutor executor = entry.getValue(); // 当前执行中的线程数 final int activeCount = executor.getActiveCount(); // 总计线程数 final int poolSize = executor.getCorePoolSize(); double used = (double)activeCount / poolSize; final int usedNum = (int) (used * 100); LOGGER.info("线程池执行状态:[{}/{}]:{}%", activeCount, poolSize, usedNum); if (used >= ALARM_PERCENT) { LOGGER.error("超出警戒值!host:{}, 当前已使用量:{}%, URL:{}", url.getIp(), usedNum, url); } } } }
-
SPI声明,创建文件 META-INF/dubbo/org.apache.dubbo.common.threadpool.ThreadPool
watching=包名.线程池名
-
在服务提供方项目引入该依赖
-
在服务提供方项目中设置使用该线程池生成器
dubbo.provider.threadpool=watching
-
接下来需要做的就是模拟整个流程,因为该线程当前是每1秒抓一次数据,所以我们需要对该方法的提供者超过1秒的时间(比如这里用休眠 Thread.sleep ),消费者则需要启动多个线程来并行执行,来模拟整个并发情况。
-
在调用方则尝试简单通过for循环启动多个线程来执行 查看服务提供方的监控情况
3.5 路由规则
路由是决定一次请求中需要发往目标机器的重要判断,通过对其控制可以决定请求的目标机器。我们可以通过创建这样的规则来决定一个请求会交给哪些服务器去处理。
3.5.1 路由规则快速入门
-
提供两个提供者(一台本机作为提供者,一台为其他的服务器),每个提供者会在调用时可以返回不同的信息 以区分提供者。
-
针对于消费者,我们这里通过一个死循环,每次等待用户输入,再进行调用,来模拟真实的请求情况。
通过调用的返回值 确认具体的提供者 -
我们通过ipconfig来查询到我们的IP地址,并且单独启动一个客户端,来进行如下配置(这里假设我们希望隔离掉本机的请求,都发送到另外一台机器上)。
public class DubboRouterMain { public static void main(String[] args) { RegistryFactory registryFactory = ExtensionLoader.getExtensionLoader(RegistryFactory.class).getAdaptiveExtension(); Registry registry = registryFactory.getRegistry(URL.valueOf("zookeeper://127.0.0.1:2181")); registry.register(URL.valueOf("condition://0.0.0.0/com.lagou.service.HelloService?category=routers&force=true&dynamic=true&rule=" + URL.encode("=> host != 你的机器ip不能是127.0.0.1"))); } }
-
通过这个程序执行后,我们就通过消费端不停的发起请求,看到真实的请求都发到了除去本机以
外的另外一台机器上。
3.5.2 路由规则详解
通过上面的程序,我们实际本质上就是通过在zookeeper中保存一个节点数据,来记录路由规则。消费者会通过监听这个服务的路径,来感知整个服务的路由规则配置,然后进行适配。这里主要介绍路由配置的参数。具体请参考文档dubbo官网路由规则,这里只对关键的参数做说明。
- route:// 表示路由规则的类型,支持条件路由规则和脚本路由规则,可扩展,必填。
- 0.0.0.0 表示对所有 IP 地址生效,如果只想对某个 IP 的生效,请填入具体 IP,必填。
- com.lagou.service.HelloService 表示只对指定服务生效,必填。
- category=routers 表示该数据为动态配置类型,必填。
- dynamic : 是否为持久数据,当指定服务重启时是否继续生效。必填。
- runtime : 是否在设置规则时自动缓存规则,如果设置为true则会影响部分性能。
- rule : 是整个路由最关键的配置,用于配置路由规则。
… => …
在这里 => 前面的就是表示消费者方的匹配规则,可以不填(代表全部)。
=> 后方则必须填写,表示当请求过来时,如果选择提供者的配置。
官方这块儿也给出了详细的示例,可以按照那里来讲。
其中使用最多的便是 host 参数。 必填。
3.5.3 路由与上线系统结合
当公司到了一定的规模之后,一般都会有自己的上线系统,专门用于服务上线,方便后期进行维护和记录的追查。
我们去想象这样的一个场景,一个dubbo的提供者要准备进行上线,一般都提供多台提供者来同时在线上提供服务。这时候一个请求刚到达一个提供者,提供者却进行了关闭操作。那么此次请求就应该认定为失败了。
所以基于这样的场景,我们可以通过路由的规则,把预发布(灰度)的机器进行从机器列表中移除。并且等待一定的时间,让其把现有的请求处理完成之后再进行关闭服务。同时,在启动时,同样需要等待一定的时间,以免因为尚未重启结束,就已经注册上去。等启动到达一定时间之后,再进行开启流量操作。
实现主体思路:
- 利用zookeeper的路径感知能力,在服务准备进行重启之前将当前机器的IP地址和应用名写入zookeeper。
- 服务消费者监听该目录,读取其中需要进行关闭的应用名和机器IP列表并且保存到内存中。
- 当前请求过来时,判断是否是请求该应用,如果是请求重启应用,则将该提供者从服务列表中移除。
3.6 服务动态降级
3.6.1 什么是服务降级?
服务降级,当服务器压力剧增的情况下,根据当前业务情况及流量对一些服务有策略的降低服务级别,以释放服务器资源,保证核心任务的正常运行。
3.6.2 为什么要服务降级
而为什么要使用服务降级,这是防止分布式服务发生雪崩效应,什么是雪崩?就是蝴蝶效应,当一个请求发生超时,一直等待着服务响应,那么在高并发情况下,很多请求都是因为这样一直等着响应,直到服务资源耗尽产生宕机,而宕机之后会导致分布式其他服务调用该宕机的服务也会出现资源耗尽宕机,这样下去将导致整个分布式服务都瘫痪,这就是雪崩。
3.6.3 dubbo 服务降级实现方式
-
在 dubbo 管理控制台配置服务降级
屏蔽和容错:
- mock=force:return+null
表示消费方对该服务的方法调用都直接返回 null 值,不发起远程调用。用来屏蔽不重要服务不可用时对调用方的影响。 - mock=fail:return+null
表示消费方对该服务的方法调用在失败后,再返回 null 值,不抛异常。用来容忍不重要服务不稳定时对调用方的影响。
- mock=force:return+null
-
指定返回简单值或者null
<dubbo:reference id="xxService" check="false" interface="com.xx.XxService" timeout="3000" mock="return null" /> <dubbo:reference id="xxService2" check="false" interface="com.xx.XxService2" timeout="3000" mock="return 1234" />
如果是标注, 则使用@Reference(mock=“return null”) @Reference(mock=“return 简单值”)
也支持 @Reference(mock=“force:return null”) -
使用java代码 动态写入配置中心
RegistryFactory registryFactory = ExtensionLoader.getExtensionLoader(RegistryFactory.class).getAdaptiveExtension(); Registry registry = registryFactory.getRegistry(URL.valueOf("zookeeper://IP:端口")); registry.register(URL.valueOf("override://0.0.0.0/com.foo.BarService?category=configurators&dynamic=false&application=foo&mock=force:return+null"));
-
整合整合 hystrix