Python 全栈系列183 元数据的规划与命名

最新推荐文章于 2023-12-04 16:15:01 发布

yukai08008

最新推荐文章于 2023-12-04 16:15:01 发布

阅读量219

点赞数

分类专栏：全栈文章标签：开发语言

本文链接：https://blog.csdn.net/yukai08008/article/details/126076722

版权

207 篇文章

订阅专栏

本文探讨了命名体系的重要性，特别是在微服务架构中。提出了基础服务、特定服务（包括GTask、FGTask和STask）的分类，并详细阐述了元数据的管理和使用，如数据区块、任务和服务的组织。使用MongoDB副本集进行存储，并强调了统一命名空间的关键作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

说明

名不正则言不顺，言不顺则事不成

命名本身是非常重要的，具体不再展开讨论了；总之，目前的当务之急是建立命名体系，这样使得概念都能够有合适的逻辑承载点。

本质上都是元数据

人能够处理的也就是元数据。我归纳了一下，目前我需要处理的几类元数据：

我是通过一个微服务体系来完成相关的功能，体系里包含了数据库、代理、门户以及各式各样的功能服务。有些是长期运行的基础服务，无论在哪台主机上都该被启动的。

**有些时候机器会迁移，此时如何在装机后一键恢复所有的微服务呢？**想象中，应该有一个地方记录了所有的微服务，然后某个程序就可以去启动这些指定的微服务。

还有一种情况是自动依赖满足。 一个微服务在启动时可以自动确保(ensure)相关的微服务在运行。

这些特定的服务通常可以认为是各种各样的"工人",执行各种各样的任务，来完成日常所有的业务需求。我将他们分为三类：

这几种任务通常是这么搭配：
STask进行嗅探，然后将变化更新到任务表；Workers会通过Manager执行这些任务(GTask)，中间可能会调用FGTask辅助。

这些特定的服务都会使用一个核心逻辑工具(SCLC)，SCLC会有数据表(sclc_df)和参数表(sclc_table)两类；要注意的是，sclc_table是元数据表，而sclc_df不一定是。

元数据的数据表会保存，但是普通数据的sclc_df是包含在任务内部的,是具体的明细数据。

这里认为要处理的数据一定有一个整型字段，按序排列。基本上可以认为就是mysql的自增主键。

会有一个主表，也是统计表。对于某一个目标数据(db.table)进行了区块划分。后面加的诸多统计都会体现在这里。另外还有一个与区块对应的任务表(Range)。

任务表除了Range还有Set。Set是离散方式的元数据任务，所以不能包含太多的id，mongo是比较合适列表的存储方式。

和数据区块类似，只不过是使用任务编号，这样会避免稀疏的问题。

基于mongo

使用mongo的副本集进行存储。这样在进行分布式计算时就会非常自然，所有机器都有同样的数据。

元数据一定是存通用副本集的，而要处理的业务数据则视情况，看是否走副本集或单机mongo。

到了最重要的部分，这里的命名空间全部是基于通用副本集下

序号	名字	解释
1	DataBlock.tier1_tier2	数据区块主表。【统计】:按照数据的id来做的区块。
2	BatchTask.tier1_tier2_function_range	区块任务。【任务】:实际要被执行的任务
3	BatchTask.tier1_tier2_function_set	离散任务。【任务】:实际要被执行的任务
4	TaskBlock.tier1_tier2	任务区块主表。【统计】:按照任务id做的区块
5	BaseService.tier1_tier2	【统计】主表，所有服务的定义在这里
6	ServiceTask.tier1_tier2	【任务】启动主表服务的任务
7	GTaskReg	GTask的定义信息。【统计】GTask注册表
8	GTask	【任务】实际的任务
9	STaskReg	【统计】GTask注册表
10	STask	【任务】实际的任务
11	FGTaskReg	【统计】GTask注册表
12	FGTask	【任务】实际的任务