Istio 实现限流的详解与实践

逆风行-华哥

已于 2024-09-20 11:21:22 修改

阅读量690

点赞数 4

分类专栏： istio 文章标签： istio 云原生

于 2024-09-20 11:14:57 首次发布

本文链接：https://blog.csdn.net/yxh1075847650/article/details/142379732

版权

istio 专栏收录该内容

2 篇文章

订阅专栏

Istio 中限流的详解与实践：本地限流与分布式限流

在当今的微服务架构中，限流（Rate Limiting）是保障系统稳定性、提升服务质量的重要手段之一。随着业务的增长，如何在分布式系统中有效地实现限流，成为了架构师和开发者们必须面对的挑战。本文将详细介绍限流的概念、重要性，并结合 Istio，深入解析如何在服务网格中实现本地限流和分布式限流，提供详细的案例说明，帮助您在实践中应用。

一、限流的概念与重要性

1.1 什么是限流

限流是指对请求的流量进行限制，即在单位时间内只允许处理一定数量的请求。当请求超过设定的阈值时，超出的请求会被拒绝或延迟处理，以保护系统不被过载。

1.2 限流的重要性

保障系统稳定性：防止突发的大量请求（如流量洪峰、恶意攻击）导致系统崩溃。
提升服务质量：确保服务对关键请求的响应速度和可靠性。
资源合理分配：避免资源被少数高频请求占用，影响其他正常请求的处理。

二、Istio 中的限流机制

2.1 Istio 简介

Istio 是一个开源的服务网格（Service Mesh）解决方案，通过在微服务之间添加一个透明的基础设施层，实现服务间通信的管理、控制和监控。

2.2 Istio 中的限流方式

Istio 提供了两种主要的限流方式：

本地限流（Local Rate Limiting）：在每个 Envoy 代理上独立进行限流控制，适用于对单个实例进行限流的场景，配置简单，无需共享状态。
全局（分布式）限流（Global Rate Limiting）：通过集中式的限流服务，实现对整个服务网格的统一限流控制，适用于需要在多个实例间共享限流状态的场景。

三、Istio 实现本地限流的详细案例

3.1 本地限流原理

本地限流是在每个 Envoy 代理上独立执行的限流，限流状态不在代理间共享。这种方式适用于对每个实例进行限流的场景，配置简单，无需额外的限流服务。

3.2 实现步骤

步骤 1：部署示例服务

以 httpbin 服务为例，部署一个简单的 HTTP 服务。

Deployment 配置：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: httpbin
  labels:
    app: httpbin
spec:
  replicas: 1
  selector:
    matchLabels:
      app: httpbin
  template:
    metadata:
      labels:
        app: httpbin
    spec:
      containers:
        - name: httpbin
          image: docker.io/kennethreitz/httpbin
          ports:
            - containerPort: 80

Service 配置：

apiVersion: v1
kind: Service
metadata:
  name: httpbin
spec:
  ports:
    - port: 80
      name: http
  selector:
    app: httpbin

应用配置：

kubectl apply -f httpbin-deployment.yaml
kubectl apply -f httpbin-service.yaml

步骤 2：配置本地限流

创建一个名为 local-rate-limit.yaml 的 EnvoyFilter 配置，用于在 Envoy 代理上启用本地限流。

apiVersion: networking.istio.io/v1alpha3
kind: EnvoyFilter
metadata:
  name: local-rate-limit
  namespace: default
spec:
  workloadSelector:
    labels:
      app: httpbin
  configPatches:
    # 插入本地限流过滤器
    - applyTo: HTTP_FILTER
      match:
        context: SIDECAR_INBOUND
        listener:
          portNumber: 80
          filterChain:
            filter:
              name: "envoy.filters.network.http_connection_manager"
      patch:
        operation: INSERT_BEFORE
        value:
          name: envoy.filters.http.local_ratelimit
          typed_config:
            "@type": type.googleapis.com/envoy.extensions.filters.http.local_ratelimit.v3.LocalRateLimit
            stat_prefix: http_local_rate_limit
            token_bucket:
              max_tokens: 5           # 令牌桶的最大令牌数
              tokens_per_fill: 5      # 每次填充的令牌数
              fill_interval: 1s       # 令牌填充间隔
            filter_enabled:
              default_value:
                numerator: 100
                denominator: HUNDRED
              runtime_key: local_rate_limit_enabled
            filter_enforced:
              default_value:
                numerator: 100
                denominator: HUNDRED
              runtime_key: local_rate_limit_enforced
            response_headers_to_add:
              - append: false
                header:
                  key: x-local-rate-limit
                  value: 'true'
    # 确保路由过滤器在限流过滤器之后
    - applyTo: HTTP_FILTER
      match:
        context: SIDECAR_INBOUND
        listener:
          portNumber: 80
          filterChain:
            filter:
              name: "envoy.filters.network.http_connection_manager"
      patch:
        operation: INSERT_AFTER
        value:
          name: envoy.filters.http.router

说明：

workloadSelector：指定该过滤器应用于 app: httpbin 的工作负载。
token_bucket：配置令牌桶算法，每秒最多允许 5 个请求。
filter_enabled 和 filter_enforced：控制过滤器的启用和强制执行。
response_headers_to_add：在响应头中添加标记，方便调试。

应用配置：

kubectl apply -f local-rate-limit.yaml

3.3 测试本地限流效果

步骤 1：获取服务入口地址

export INGRESS_HOST=$(kubectl -n istio-system get service istio-ingressgateway -o jsonpath='{.status.loadBalancer.ingress[0].ip}')

步骤 2：发送测试请求

for i in {1..10}; do curl -I http://$INGRESS_HOST/get; done

预期结果

前 5 个请求：返回 200 OK。
后 5 个请求：返回 429 Too Many Requests，并在响应头中包含 x-local-rate-limit: true。

验证响应

HTTP/1.1 200 OK
...
HTTP/1.1 429 Too Many Requests
x-local-rate-limit: true
...

3.4 调整限流策略

您可以根据需要调整限流参数，例如每秒允许的请求数、令牌桶大小等。

token_bucket:
  max_tokens: 10          # 最大令牌数
  tokens_per_fill: 10     # 每次填充的令牌数
  fill_interval: 1s       # 填充间隔

四、Istio 实现分布式限流的详细案例

4.1 分布式限流原理

分布式限流需要一个集中式的限流服务，Envoy 代理通过与该服务交互，实现多个实例之间的限流状态共享。

4.2 实现步骤

步骤 1：部署限流服务

首先，我们需要部署一个限流服务，这里使用 Lyft 开源的 ratelimit 服务。

创建限流配置 ConfigMap

apiVersion: v1
kind: ConfigMap
metadata:
  name: ratelimit-config
  namespace: istio-system
data:
  config.yaml: |
    domain: echo
    descriptors:
      - key: generic_key
        value: slowpath
        rate_limit:
          unit: second
          requests_per_unit: 1

部署限流服务

apiVersion: apps/v1
kind: Deployment
metadata:
  name: ratelimit
  namespace: istio-system
spec:
  replicas: 1
  selector:
    matchLabels:
      app: ratelimit
  template:
    metadata:
      labels:
        app: ratelimit
    spec:
      containers:
        - name: ratelimit
          image: envoyproxy/ratelimit:latest
          ports:
            - containerPort: 8080
            - containerPort: 6070
          volumeMounts:
            - name: config-volume
              mountPath: /data/ratelimit/config
      volumes:
        - name: config-volume
          configMap:
            name: ratelimit-config
---
apiVersion: v1
kind: Service
metadata:
  name: ratelimit
  namespace: istio-system
spec:
  ports:
    - port: 8080
      name: http
  selector:
    app: ratelimit

应用配置：

kubectl apply -f ratelimit-config.yaml
kubectl apply -f ratelimit-deployment.yaml

步骤 2：配置 EnvoyFilter

创建一个名为 ratelimit-filter.yaml 的文件，配置 EnvoyFilter，将限流过滤器集成到 Envoy 代理中。

apiVersion: networking.istio.io/v1alpha3
kind: EnvoyFilter
metadata:
  name: ratelimit-filter
  namespace: istio-system
spec:
  configPatches:
    - applyTo: HTTP_FILTER
      match:
        context: ANY
        listener:
          filterChain:
            filter:
              name: "envoy.filters.network.http_connection_manager"
      patch:
        operation: INSERT_BEFORE
        value:
          name: envoy.filters.http.ratelimit
          typed_config:
            "@type": type.googleapis.com/envoy.extensions.filters.http.ratelimit.v3.RateLimit
            domain: echo
            failure_mode_deny: false
            rate_limit_service:
              grpc_service:
                envoy_grpc:
                  cluster_name: rate_limit_cluster
                timeout: 0.25s
    - applyTo: CLUSTER
      match:
        cluster:
          service: ratelimit.istio-system.svc.cluster.local
      patch:
        operation: ADD
        value:
          name: rate_limit_cluster
          type: STRICT_DNS
          connect_timeout: 0.25s
          http2_protocol_options: {}
          lb_policy: ROUND_ROBIN
          load_assignment:
            cluster_name: rate_limit_cluster
            endpoints:
              - lb_endpoints:
                  - endpoint:
                      address:
                        socket_address:
                          address: ratelimit.istio-system.svc.cluster.local
                          port_value: 8080

应用配置：

kubectl apply -f ratelimit-filter.yaml

步骤 3：配置 VirtualService

为目标服务配置路由规则，匹配特定的请求，并应用限流。

apiVersion: networking.istio.io/v1beta1
kind: VirtualService
metadata:
  name: httpbin
spec:
  hosts:
    - "*"
  gateways:
    - istio-system/istio-ingressgateway
  http:
    - match:
        - uri:
            prefix: "/"
      route:
        - destination:
            host: httpbin
            port:
              number: 80
      headers:
        request:
          add:
            x-envoy-rate-limit-descriptor: |
              [{"key": "generic_key", "value": "slowpath"}]

应用配置：

kubectl apply -f httpbin-virtualservice.yaml

4.3 测试分布式限流效果

步骤 1：获取 Ingress 网关地址

export INGRESS_HOST=$(kubectl -n istio-system get service istio-ingressgateway -o jsonpath='{.status.loadBalancer.ingress[0].ip}')

步骤 2：发送请求

for i in {1..5}; do curl -I http://$INGRESS_HOST/get; sleep 0.2; done

预期结果

第一个请求返回 200 OK。
后续请求在一秒内将返回 429 Too Many Requests。

五、Istio 限流方式的比较

5.1 本地限流 vs 分布式限流

特性	本地限流	分布式限流
实现复杂度	低，配置简单，无需额外服务	高，需要部署限流服务
性能开销	低，限流在本地执行，无额外网络通信	较高，增加了代理与限流服务的通信延迟
状态共享	无法共享，每个实例独立限流	状态共享，限流服务统一管理
适用场景	单实例保护，限制每个 Pod 的请求速率	全局请求限制，控制整个服务的总请求速率
扩展性	高，增加实例不会影响限流策略	需考虑限流服务的性能和扩展性