一、SpringBoot项⽬⾥⾯Http客户端默认的RestTemplate⾥⾯的存在的问题你知道多少
回答
(一)RestTemplate介绍
1、RestTemplate是Spring提供的⽤于访问Rest服务的客户端
2、底层通过使⽤java.net包下的实现创建HTTP 请求
3、通过使⽤ClientHttpRequestFactory指定不同的HTTP请求⽅式,主要提供了两种实现⽅式
(1)SimpleClientHttpRequestFactory(默认)
①底层使⽤J2SE提供的⽅式,既java.net包提供的⽅式,创建底层的Http请求连接
②主要createRequest ⽅法( 断点调试),每次都会创建⼀个新的连接,每次都创建连接会造成极⼤的资源浪费,⽽且若连接不能及时释放,会因为⽆法建⽴新的连接导致后⾯的请求阻塞
(2)HttpComponentsClientHttpRequestFactory
底层使⽤HttpClient访问远程的Http服务
(二)问题定位
1、客户端每次请求都要和服务端建⽴新的连接,即三次握⼿将会⾮常耗时
2、通过http连接池可以减少连接建⽴与释放的时间,提升http请求的性能
3、Spring的restTemplate是对httpclient进⾏了封装, ⽽httpclient是⽀持池化机制
4、拓展
对httpclient进⾏封装的有:Apache的Fluent、es的restHighLevelClient、spring的restTemplate等
(三)SpringBoot连接池配置
@Bean
public RestTemplate
restTemplate(ClientHttpRequestFactory factory) {
return new RestTemplate(factory);
}
@Bean
public ClientHttpRequestFactory
httpRequestFactory() {
return new
HttpComponentsClientHttpRequestFactory(httpClient(
));
}
/**
* @return
*/
@Bean
public HttpClient httpClient() {
Registry<ConnectionSocketFactory> registry
= RegistryBuilder.
<ConnectionSocketFactory>create()
.register("http",
PlainConnectionSocketFactory.getSocketFactory())
.register("https",
SSLConnectionSocketFactory.getSocketFactory())
.build();
PoolingHttpClientConnectionManager
connectionManager = new
PoolingHttpClientConnectionManager(registry);
//设置整个连接池最⼤连接数
connectionManager.setMaxTotal(500);
//MaxPerRoute路由是对maxTotal的细分,每个主机的
并发,这⾥route指的是域名
connectionManager.setDefaultMaxPerRoute(200);
RequestConfig requestConfig =
RequestConfig.custom()
//返回数据的超时时间
.setSocketTimeout(20000)
//连接上服务器的超时时间
.setConnectTimeout(10000)
//从连接池中获取连接的超时时间
.setConnectionRequestTimeout(1000)
.build();
return HttpClientBuilder.create()
.setDefaultRequestConfig(requestConfig)
.setConnectionManager(connectionManager)
.build();
}
二、什么是Rebalance操作
前提:70个分区,10个消费者,但是先启动⼀个消费者,后续再启动⼀个消费者,这个会怎么分配?当消费者在消费过程突然宕机了,重新恢复后是从哪⾥消费,会有什么问题?
回答
(一)什么是Rebalance操作
1、kafka 怎么均匀地分配某个 topic 下的所有 partition 到各个消费者,从⽽使得消息的消费速度达到最快,这就是平衡(balance),前⾯讲了 Range 范围分区 和 RoundRobin 轮询分区,也⽀持⾃定义分区策略。
2、⽽ rebalance(重平衡)其实就是重新进⾏ partition 的分配,从⽽使得 partition 的分配重新达到平衡状态
(二)⾯试
1、例如70个分区,10个消费者,但是先启动⼀个消费者,后续再启动⼀个消费者,这个会怎么分配?
Kafka 会进⾏⼀次分区分配操作,即 Kafka 消费者端的Rebalance 操作 ,下⾯都会发⽣rebalance操作
①当消费者组内的消费者数量发⽣变化(增加或者减少),就会产⽣重新分配patition
②分区数量发⽣变化时(即 topic 的分区数量发⽣变化时)
(三)⾯试:当消费者在消费过程突然宕机了,重新恢复后是从哪⾥消费,会有什么问题?
1、消费者会记录offset,故障恢复后从这⾥继续消费,这个offset记录在哪⾥?
2、记录在zk⾥⾯和本地,新版默认将offset保证在kafka的内置topic中,名称是 __consumer_offsets
(1)该Topic默认有50个Partition,每个Partition有3个副本,分区数量由参数offset.topic.num.partition配置
(2)通过groupId的哈希值和该参数取模的⽅式来确定某个消费者组已消费的offset保存到__consumer_offsets主题的哪个分区中
(3)由 消费者组名+主题+分区,确定唯⼀的offset的key,从⽽获取对应的值
(4)三元组:group.id+topic+分区号,⽽ value 就是 offset的值
三、 Http状态码里面的1xx/2xx/3xx/4xx/5xx主要应用场景是?
回答
(一)浏览器向服务器请求时,服务端响应的消息头里面有状态码,表示请求结果的状态分类
1、1XX: 收到请求,需要请求者继续执行操作,比较少用
2、2XX: 请求成功,常用的 200
3、3XX: 重定向,浏览器在拿到服务器返回的这个状态码后会自动跳转到一个新的URL地址,这个地址可以从响应的Location首部中获取;
4、好处:网站改版、域名迁移等,多个域名指向同个主站导流
必须记住
①301:永久性跳转,比如域名过期,换个域名
②302:临时性跳转
(三)4XX: 客服端出错,请求包含语法错误或者无法完成请求
必须记住:
(1)400: 请求出错,比如语法协议
(2)403: 没权限访问
(3)404: 找不到这个路径对应的接口或者文件
(4)405: 不允许此方法进行提交,Method not allowed,比如接口一定要POST方式,而你是用
了GET
(四)5XX: 服务端出错,服务器在处理请求的过程中发生了错误
必须记住:
(1)500: 服务器内部报错了,完成不了这次请求
(2)503: 服务器宕机
四、Dubbo服务调用超时怎么办?
回答
dubbo在调用服务不成功时,默认是会重试两次的。这样在服务端的处理时间超过了设定的超时时间时,就会有重复请求,此时在接口设计的时候,需要考虑接口的幂等性,避免重复调用导致出现脏数据。
五、Dubbo的负载均衡策略有哪些?
回答
主要有random(随机,这种是默认的负载均衡策略)、RoundRobin (轮询)、LeastActive (最少活跃数)、ConsistentHash(一致性hash)可以在暴露服务的时候使用loadbalance进行指定。
随机:在一个截面上碰撞的概率高,调用量越大分布越均匀,而且按概率使用权重后也比较均匀,有利于动态调整提供者权重。
轮询:存在慢的提供者累积请求的问题,一台机器很慢,但没挂,当请求轮询到那台机子就卡在那,久而久之,所有请求都卡在那台服务器上。
最少活跃数:使慢的提供者收到更少请求,因为越慢的提供者的调用前后计数差会越大。
一致性hash:当某一台提供者挂时,原本发往该提供者的请求,基于虚拟节点,平摊到其它提供者,不会引起剧烈变动。可以方便节点的增加及移除