Cloudkitty Data Flow（Newton版）

最新推荐文章于 2023-07-03 00:05:17 发布

Roger_Yu_

最新推荐文章于 2023-07-03 00:05:17 发布

阅读量1k

点赞数

分类专栏： openstack 文章标签： openstack cloudkitty 源码分析计费

本文链接：https://blog.csdn.net/u010433148/article/details/76973800

版权

openstack 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

一、简介

架构图

cloudkitty总共有两个服务（进程），cloudkitty-api和cloudkitty-processor

cloudkitty-api服务作为外界访问cloudkitty的统一接口，可以分为两组api，文档如下：cloudkitty API，通过rpc与cloudkitty-processor服务进行通信。

cloudkitty-processor进程的主要工作有：

接收API发来的RPC消息，比如更新module的状态或优先级
启动循环任务，在每一个计费周期内，对每个计费租户的资源使用情况进行查询和计费（又可细分为以下内容：）
- 收集计费租户信息（TenantFetcher）
- 获取资源使用数据（Collector）
- 格式化资源使用数据（Transformers）
- 依据计费策略计费（Rating）
- 存储计费信息（Storage）

二、cloudkitty-api剖析

1.wsgi服务初始化

 
          def  
          main(): 
         
          service.prepare_service() 
         
          server  
          =  
          app.build_server() 
         
          try 
          : 
         
          server.serve_forever()

service.prepare_service()：初始化log并修改配置文件默认值；

app.build_server()：创建启动WSGI服务，load_app加载各个应用

 
            #/etc/cloudkitty/api_paste.ini 
           
            [pipeline:main] 
           
            pipeline  
            =  
            cors http_proxy_to_wsgi request_id authtoken ck_api_v1 
           
            [app:ck_api_v1] 
           
            paste.app_factory  
            =  
            cloudkitty.api.app:app_factory 
           
            [ 
            filter 
            :authtoken] 
           
            acl_public_routes  
            =  
            / 
            ,  
            / 
            v1 
           
            paste.filter_factory  
            =  
            cloudkitty.api.middleware:AuthTokenMiddleware.factory 
           
            [ 
            filter 
            :request_id] 
           
            paste.filter_factory  
            =  
            oslo_middleware:RequestId.factory 
           
            [ 
            filter 
            :cors] 
           
            paste.filter_factory  
            =   
            oslo_middleware.cors:filter_factory 
           
            oslo_config_project  
            =  
            cloudkitty 
           
            [ 
            filter 
            :http_proxy_to_wsgi] 
           
            paste.filter_factory  
            =  
            oslo_middleware.http_proxy_to_wsgi:HTTPProxyToWSGI.factory 
           
            oslo_config_project  
            =  
            cloudkitty

由上可知client请求进来最终路由到cloudkitty.api.app:app_factory

 
            def  
            app_factory(global_config,  
            * 
            * 
            local_conf): 
           
            return  
            setup_app() 
           
            def  
            setup_app(pecan_config 
            = 
            None 
            , extra_hooks 
            = 
            None 
            ): 
           
            app_conf  
            =  
            get_pecan_config() 
           
            storage_backend  
            =  
            storage.get_storage() 
           
            app_hooks  
            =  
            [ 
           
            hooks.RPCHook(), 
           
            hooks.StorageHook(storage_backend), 
           
            hooks.ContextHook(), 
           
            ] 
           
            app  
            =  
            pecan.make_app( 
           
            app_conf.app.root, 
           
            static_root 
            = 
            app_conf.app.static_root, 
           
            template_path 
            = 
            app_conf.app.template_path, 
           
            debug 
            = 
            CONF.api.pecan_debug, 
           
            force_canonical 
            = 
            getattr 
            (app_conf.app,  
            'force_canonical' 
            ,  
            True 
            ), 
           
            hooks 
            = 
            app_hooks, 
           
            guess_content_type_from_ext 
            = 
            False 
           
            ) 
           
            return  
            app

app定义在app_conf.app.root中，其中有v1 = v1_api.V1Controller()：

 
            #cloudkitty/api/v1/__init__() 
           
            class  
            V1Controller(rest.RestController): 
           
            billing  
            =  
            rating_api.RatingController() 
           
            collector  
            =  
            collector_api.CollectorController() 
           
            rating  
            =  
            rating_api.RatingController() 
           
            report  
            =  
            report_api.ReportController() 
           
            storage  
            =  
            storage_api.StorageController() 
           
            info  
            =  
            info_api.InfoController()

其中比较特殊的类是rating_api.RatingController()，该类中的reload_modules方法会动态加载计费模块的API：

 
            class  
            RatingController(rest.RestController): 
           
            @wsme_pecan 
            .wsexpose( 
            None 
            ) 
           
            def  
            reload_modules( 
            self 
            ): 
           
            policy.enforce(pecan.request.context,  
            'rating:module_config' 
            , {}) 
           
            self 
            .modules.reload_extensions() 
           
            self 
            .module_config.reload_extensions() 
           
            self 
            .module_config.expose_modules()

其中self.modules.reload_extensions()为父类RatingModulesMixin()中的方法：

 
            PROCESSORS_NAMESPACE  
            =  
            'cloudkitty.rating.processors' 
           
            def  
            reload_extensions( 
            self 
            ): 
           
            lock  
            =  
            lockutils.lock( 
            'rating-modules' 
            ) 
           
            with lock: 
           
            ck_utils.refresh_stevedore(PROCESSORS_NAMESPACE) 
           
            self 
            .extensions  
            =  
            extension.ExtensionManager( 
           
            PROCESSORS_NAMESPACE, 
           
            invoke_on_load 
            = 
            True 
            ) 
           
            if  
            not  
            self 
            ._first_call: 
           
            self 
            .notify_reload() 
           
            else 
            : 
           
            self 
            ._first_call  
            =  
            False

依据setup.cfg，可知‘cloudkitty.rating.processors’命名空间对应下述计费模块

 
            cloudkitty.rating.processors  
            = 
           
            noop  
            =  
            cloudkitty.rating.noop:Noop 
           
            hashmap  
            =  
            cloudkitty.rating. 
            hash 
            :HashMap 
           
            pyscripts  
            =  
            cloudkitty.rating.pyscripts:PyScripts

至此，cloudkitty-api服务中的两组api入口清晰可见，若采用pyscripts（即第三方计费模块脚本），流程也是类似，需要在对应的文件中添加第三方的内容即可

server.serve_forever()：循环接受client请求，如果有请求来，经finish_request方法把请求交给RequestHandlerClass处理，RequestHandlerClass调用handle()方法处理request，WSGIRequestHandler的handle()方法把request又交给ServerHandler处理，ServerHandler调用run执行application方法。

2.API预览

COMMON REST API （v1）
方法	路径	功能
GET	/v1/collector/mappings	返回映射到collector的每个service的列表
GET	/v1/collector/mappings/(service)	获取service到mappings的映射关系
POST	/v1/collector/mappings	创建service到collector的映射
DELETE	/v1/collector/mappings	删除service到collector的映射
GET	/v1/collector/states	获取collector的使能状态
PUT	/v1/collector/states	设置collector的使能状态
GET	/v1/info/config	获取当前配置
GET	/v1/info/services	获取service列表
GET	/v1/info/services/(service_name)	获取某个service
GET	/v1/rating/modules	获取modules列表
GET	/v1/rating/modules/(module_id)	获取某个module
PUT	/v1/rating/modules	更改模块的状态及优先级
POST	/v1/rating/quota	根据多个资源描述获取即时报价
GET	/v1/rating/reload_modules	触发计费模块module列表重载
GET	/v1/report/summary	获取给定期间的总额
GET	/v1/report/tenants	获取计费租户名单
GET	/v1/report/total	获取给定期间的支付金额
GET	/v1/storage/dataframes	获取一段时间和租户的额定资源列表
HashMap Module REST API
方法	路径	功能
GET	/v1/rating/module_config/hashmap/types	获取所有可用mapping类型
GET	/v1/rating/module_config/hashmap/services	获取service列表
GET	/v1/rating/module_config/hashmap/services/(service_id)	获取某个service
POST	/v1/rating/module_config/hashmap/services	创建一个hashmap service
DELETE	/v1/rating/module_config/hashmap/services	删除某个service及子项
GET	/v1/rating/module_config/hashmap/fields	获取field列表
GET	/v1/rating/module_config/hashmap/fields/(field_id)	获取某个field
POST	/v1/rating/module_config/hashmap/fields	创建一个field
DELETE	/v1/rating/module_config/hashmap/fields	删除某个field及子项
GET	/v1/rating/module_config/hashmap/mappings	获取mapping列表
GET	/v1/rating/module_config/hashmap/mappings/(mapping_id)	获取某个mapping
POST	/v1/rating/module_config/hashmap/mappings	创建一个mapping
PUT	/v1/rating/module_config/hashmap/mappings	更新某个mapping
DELETE	/v1/rating/module_config/hashmap/mappings	删除某个mapping
GET	/v1/rating/module_config/hashmap/mappings/group	获取某个mapping上附加的group
GET	/v1/rating/module_config/hashmap/groups	获取group列表
GET	/v1/rating/module_config/hashmap/groups/(group_id)	获取某个group
POST	/v1/rating/module_config/hashmap/groups	创建一个group
DELETE	/v1/rating/module_config/hashmap/groups	删除一个group
GET	/v1/rating/module_config/hashmap/groups/mappings	获取被附加到某个group上的mappings
GET	/v1/rating/module_config/hashmap/groups/thresholds	获取被附加到某个group上的thresholds

三、cloudkitty-processer剖析

1.服务初始化

cloudkitty-processer的启动代码在cli/processer.py中，如下：

 
          from  
          cloudkitty  
          import  
          orchestrator 
         
          def  
          main(): 
         
          service.prepare_service() 
         
          processor  
          =  
          orchestrator.Orchestrator() 
         
          try 
          : 
         
          processor.process() 
         
          except  
          KeyboardInterrupt: 
         
          processor.terminate()

该进程主要的初始化代码在orchestrator这个库中，位于cloudkitty的根目录下。先看看orchestrator.Orchestrator()这个类如何初始化

 
          class  
          Orchestrator( 
          object 
          ): 
         
          def  
          __init__( 
          self 
          ): 
         
          # Tenant fetcher 
         
          self 
          .fetcher  
          =  
          driver.DriverManager( 
         
          FETCHERS_NAMESPACE, 
         
          CONF.tenant_fetcher.backend, 
         
          invoke_on_load 
          = 
          True 
          ).driver 
         
          self 
          .transformers  
          =  
          transformer.get_transformers() 
         
          self 
          .collector  
          =  
          collector.get_collector( 
          self 
          .transformers) 
         
          self 
          .storage  
          =  
          storage.get_storage( 
          self 
          .collector) 
         
          # RPC 
         
          self 
          .server  
          =  
          None 
         
          self 
          ._rating_endpoint  
          =  
          RatingEndpoint( 
          self 
          ) 
         
          self 
          ._init_messaging() 
         
          # DLM 
         
          self 
          .coord  
          =  
          coordination.get_coordinator( 
         
          CONF.orchestrator.coordination_url, 
         
          uuidutils.generate_uuid().encode( 
          'ascii' 
          )) 
         
          self 
          .coord.start() 
         
          self 
          ._period  
          =  
          CONF.collect.period 
         
          self 
          ._wait_time  
          =  
          CONF.collect.wait_periods  
          *  
          self 
          ._period

可以看到分别初始化了fetcher、transformers、collector、storage。然后初始化了tooz库的coordination，后续利用其分布式锁功能，通过fetcher获取需要计费的tenant ID（即project_id），然后依照计费逻辑轮循各个project时，保证每个project不被中断。

首先是fetcher，调用stevedore库以driver的形式动态加载，对应的后端可以有：

 
          cloudkitty.tenant.fetchers  
          = 
         
          fake  
          =  
          cloudkitty.tenant_fetcher.fake:FakeFetcher 
         
          keystone  
          =  
          cloudkitty.tenant_fetcher.keystone:KeystoneFetcher

transformers的初始化也类似，其后端命名空间：TRANSFORMERS_NAMESPACE = 'cloudkitty.transformers'，在setup.cfg中：

 
          cloudkitty.transformers  
          = 
         
          CloudKittyFormatTransformer  
          =  
          cloudkitty.transformer. 
          format 
          :CloudKittyFormatTransformer 
         
          CeilometerTransformer  
          =  
          cloudkitty.transformer.ceilometer:CeilometerTransformer 
         
          GnocchiTransformer  
          =  
          cloudkitty.transformer.gnocchi:GnocchiTransformer

collector、storage也都类似：

 
          cloudkitty.collector.backends  
          = 
         
          fake  
          =  
          cloudkitty.collector.fake:CSVCollector 
         
          ceilometer  
          =  
          cloudkitty.collector.ceilometer:CeilometerCollector 
         
          gnocchi  
          =  
          cloudkitty.collector.gnocchi:GnocchiCollector 
         
          meta  
          =  
          cloudkitty.collector.meta:MetaCollector 
         
          cloudkitty.storage.backends  
          = 
         
          sqlalchemy  
          =  
          cloudkitty.storage.sqlalchemy:SQLAlchemyStorage 
         
          gnocchihybrid  
          =  
          cloudkitty.storage.gnocchi_hybrid:GnocchiHybridStorage 
         
          gnocchi  
          =  
          cloudkitty.storage.gnocchi:GnocchiStorage

由上可以看出，主要的组件均允许后端以插件的形式插入。再来看processor的主要逻辑：

2.cloudkitty-processor主要逻辑

以下是processor的主要逻辑：

这里简要画了一幅processor的逻辑图：

接下来看代码

 
          def  
          process( 
          self 
          ): 
         
          while  
          True 
          : 
         
          self 
          .process_messages() 
         
          self 
          ._load_tenant_list() 
         
          while  
          len 
          ( 
          self 
          ._tenants): 
         
          for  
          tenant  
          in  
          self 
          ._tenants[:]: 
         
          lock  
          =  
          self 
          ._lock(tenant) 
         
          if  
          lock.acquire(blocking 
          = 
          False 
          ): 
         
          if  
          not  
          self 
          ._check_state(tenant): 
         
          self 
          ._tenants.remove(tenant) 
         
          else 
          : 
         
          worker  
          =  
          Worker( 
          self 
          .collector,  
          self 
          .storage, tenant) 
         
          worker.run() 
         
          lock.release() 
         
          self 
          .coord.heartbeat() 
         
          eventlet.sleep( 
          1 
          ) 
         
          eventlet.sleep( 
          self 
          ._period)

首先_load_tenant_list()加载所有的project，在for循环中，对每个project建立锁，并判断当前project的状态(判断是否处于下个执行周期)，若处于可执行周期，则调用worker.run

 
          def  
          run( 
          self 
          ): 
         
          while  
          True 
          : 
         
          timestamp  
          =  
          self 
          .check_state() 
         
          if  
          not  
          timestamp: 
         
          break 
         
          for  
          service  
          in  
          CONF.collect.services: 
         
          try 
          : 
         
          try 
          : 
         
          data  
          =  
          self 
          ._collect(service, timestamp) 
         
          except  
          collector.NoDataCollected: 
         
          raise 
         
          except  
          Exception as e: 
         
          LOG.warning( 
         
          _LW( 
          'Error while collecting service ' 
         
          '%(service)s: %(error)s' 
          ), 
         
          { 
          'service' 
          : service,  
          'error' 
          : e}) 
         
          raise  
          collector.NoDataCollected('', service) 
         
          except  
          collector.NoDataCollected: 
         
          begin  
          =  
          timestamp 
         
          end  
          =  
          begin  
          +  
          self 
          ._period 
         
          for  
          processor  
          in  
          self 
          ._processors: 
         
          processor.obj.nodata(begin, end) 
         
          self 
          ._storage.nodata(begin, end,  
          self 
          ._tenant_id) 
         
          else 
          : 
         
          # Rating 
         
          for  
          processor  
          in  
          self 
          ._processors: 
         
          processor.obj.process(data) 
         
          # Writing 
         
          self 
          ._storage.append(data,  
          self 
          ._tenant_id) 
         
          # We're getting a full period so we directly commit 
         
          self 
          ._storage.commit( 
          self 
          ._tenant_id)

2.1 Collect

首先明确一点，run方法执行于某个project的计费周期内，获取可用的collect services，调用self._collect()方法，其中该方法中的self._collector在Worker类初始化时传入，对应processor服务初始化的collector，对应的collector后端具体方法位置在setup.cfg中定义，前面已经列出。这里看self._collect()方法：

 
          def  
          _collect( 
          self 
          , service, start_timestamp): 
         
          next_timestamp  
          =  
          start_timestamp  
          +  
          self 
          ._period 
         
          raw_data  
          =  
          self 
          ._collector.retrieve(service, 
         
          start_timestamp, 
         
          next_timestamp, 
         
          self 
          ._tenant_id) 
         
          if  
          raw_data: 
         
          return  
          [{ 
          'period' 
          : { 
          'begin' 
          : start_timestamp, 
         
          'end' 
          : next_timestamp}, 
         
          'usage' 
          : raw_data}]

其中self._collector.retrieve()方法对应不同的后端有不同的实现，默认Ceilometer为collector后端时，retrieve()方法位于collector.__init__的BaseCollector基类中，其余各后端均有自己的实现（例如gnocchi为后端时，retrieve()方法位于collector.gnocchi.GnocchiCollector中）

以Ceilometer为后端为例：

 
          #/collector/__init__.py 
         
          def  
          retrieve( 
          self 
          , resource, start, end 
          = 
          None 
          , project_id 
          = 
          None 
          , q_filter 
          = 
          None 
          ): 
         
          trans_resource  
          =  
          self 
          ._res_to_func(resource) 
         
          if  
          not  
          hasattr 
          ( 
          self 
          , trans_resource): 
         
          raise  
          NotImplementedError( 
         
          "No method found in collector '%s' for resource '%s'." 
         
          %  
          ( 
          self 
          .collector_name, resource)) 
         
          func  
          =  
          getattr 
          ( 
          self 
          , trans_resource) 
         
          return  
          func(start, end, project_id, q_filter)

会获取self中是否具有get_[resource]的方法，若有则调用该方法，比如resource为image:

 
          #/collector/ceilometer.py 
         
          def  
          get_image( 
          self 
          , start, end 
          = 
          None 
          , project_id 
          = 
          None 
          , q_filter 
          = 
          None 
          ): 
         
          active_image_stats  
          =  
          self 
          .resources_stats( 
          'image.size' 
          , start, end, project_id, q_filter) 
         
          image_data  
          =  
          [] 
         
          for  
          image_stats  
          in  
          active_image_stats: 
         
          image_id  
          =  
          image_stats.groupby[ 
          'resource_id' 
          ] 
         
          if  
          not  
          self 
          ._cacher.has_resource_detail( 
          'image' 
          , image_id): 
         
          raw_resource  
          =  
          self 
          ._conn.resources.get(image_id) 
         
          image  
          =  
          self 
          .t_ceilometer.strip_resource_data( 
          'image' 
          , 
         
          raw_resource) 
         
          self 
          ._cacher.add_resource_detail( 
          'image' 
          , 
         
          image_id, 
         
          image) 
         
          image  
          =  
          self 
          ._cacher.get_resource_detail( 
          'image' 
          , 
         
          image_id) 
         
          image_size_mb  
          =  
          decimal.Decimal(image_stats. 
          max 
          )  
          /  
          units.Mi 
         
          image_data.append( 
         
          self 
          .t_cloudkitty.format_item(image,  
          self 
          .units_mappings[ 
         
          "image" 
          ], image_size_mb)) 
         
          if  
          not  
          image_data: 
         
          raise  
          collector.NoDataCollected( 
          self 
          .collector_name,  
          'image' 
          ) 
         
          return  
          self 
          .t_cloudkitty.format_service( 
          'image' 
          , image_data)

可以看到最终会调用Ceilometer的client去获取image的相关信息。

2.2 Rating

回到Worker.run方法中:

 
          #/collector/__init__.py 
         
          # Rating 
         
          for  
          processor  
          in  
          self 
          ._processors: 
         
          processor.obj.process(data)

其中self._processors在Worker的父类BaseWorker中被初始化，对应的命名空间为PROCESSORS_NAMESPACE = 'cloudkitty.rating.processors' 下面贴出该命名空间对应setup.cfg中的内容：

 
          cloudkitty.rating.processors  
          = 
         
          noop  
          =  
          cloudkitty.rating.noop:Noop 
         
          hashmap  
          =  
          cloudkitty.rating. 
          hash 
          :HashMap 
         
          pyscripts  
          =  
          cloudkitty.rating.pyscripts:PyScripts

所以这里调用processor.obj.process()方法来处理前面collector收集回来的resource信息，默认后端采用hashmap计费模块的逻辑，具体方法不细致分析。

2.3 Writing

类似前面两个步骤，均是通过调用插件的驱动来完成功能，不重复展开。

Roger_Yu_

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Cloudkitty Data Flow（Newton版）

一、简介架构图cloudkitty总共有两个服务（进程），cloudkitty-api和cloudkitty-processorcloudkitty-api服务作为外界访问cloudkitty的统一接口，可以分为两组api，文档如下：cloudkitty API，通过rpc与cloudkitty-processor服务进行通信。cloudkitty-proc
复制链接

扫一扫

专栏目录