测试数据心得——holo

        目前是做报表项目,经常会有新的报表通过新的视图呈现在前端,所以经常需要在新表里面造数据,有一个区划维度大概有100+,另外还有一些其他维度,此为背景,使用数据库为holo

1、整理区划维度 

区划维度是以拉链形式存于表中,这一块就需要根据根节点将整个数据平铺起来,将数据放入临时表中

select   
t1.code 大区code,t1.name 大区名称,
t2.code 城市code,t2.name 城市名称,
t3.code 团队code,t3.name 团队名称,
t4.code 门店code,t4.name 门店名称

from (select  id,name,parent_id,code  from  data_permission where  parent_id in 
        -- 从这个子查询中获取根节点
       (select id from data_permission where data_type = 'BI.Data.Delivery.Area')     
     ) t1 
left join data_permission t2 on  t1.id   =  t2.parent_id
left join data_permission t3 on  t2.id   =  t3.parent_id  
left join data_permission t4 on  t3.id   =  t4.parent_id  
order by t1.code,t2.code,t3.code,t4.code;

2、将测试数据存入维度表中,此表专为测试数据服务,直接使用中文命名 

-- 交付区划辅助表
drop table if exists ads.交付区划辅助表;
create table ads.交付区划辅助表
(
    大区编码 text,大区名称 text,城市编码 text,城市名称 text,门店编码 text,门店名称 text
);


-- 将查到到平铺数据插入到辅助表里面
INSERT INTO  ads.交付区划辅助表 (大区编码,大区名称,城市编码,城市名称,门店编码,门店名称) 
VALUES
 ('#999','其他','#999','其他','#999','其他'),
。。。
。。。

3、从维度表里面造多个时间节点的数据

作用:ads.交付区划辅助表中的数据存放到业务表里面,一天内每条区划生成 (24/ 4Hours)=6 条数据,最终结果:

  • 业务表1天的数据=   6 *  ads.交付区划辅助表.size()
  • 整个表中的数据 =  230天的数据(前100天+后130天)
-- 插入日期和区划维度
insert into 业务表(biz_datetime,big_area_code,city_code,store_code)
select generate_series(current_date - 100,current_date + 130, '4 hours'),大区编码,城市编码,门店编码
from ads.交付区划辅助表 ;

以上的数据是基于当前日期 ,历史时间造100天以前以及130天以后

1天一份的话,4 hours可以改成1 days

如果是数据少的话,可以 使用迪卡尔积形式,但是我这边数据维度如果使用迪卡尔积的话,一天的数据都可以达到十数万,所以取某一个维度较多的数据作为基础维度,然后其他维度使用随机生成,这种数据基本满足所有维度都可以命中

4、不规则维度测试数据处理

造数据时,有些是是规则维度 ,有些是不规则维度,可以 使用case when 转为真实维度,

例: 枚举: aa,bb,cc

update 业务表
set 
enum_code = ceil(random()*4) where true;

update 业务表
set 
enum_code = 
    case enum_code 
        when '1' then 'aa' 
        when '2' then 'bb' 
        when '3' then 'cc' 
        else enum_code end 
where true;

5、复杂且经常变动的维度处理

case when 虽然好用,但是添加或减少维度的时候,需要每个表的测试脚本都需要维护一遍

如果是oracle或mysql可以直接写函数更好,holo不支持自定义函数编写,所以将经常变动的维度数据放入一张临时表里面,使用联表进行更新,目前使用的是字典表,在里面添加一个辅助字段


insert into ads.车系版型辅助表 (辅助字段,版型code,版型名称,车系code)
values 

(1,'1','aaa','1'),
(2,'2','bbb','1'),
(3,'3','ccc','1'),
(4,'7','ddd','1'), 
。。。。。



-- 放入随机数据=字典表版型的数量长度       ceil(random()*18)  会随机生成  1~18    
update ads.业务表 
set 
car_type_code = ceil(random()*18) where true;



-- 规整版型车系: 将随机产生的序号转成字典里面的业务code,
-- 跟case when 比起来的好处是:新加维度时,只需要维护字典表即可
update ads.业务表 
SET 
car_model_code = (select 车系code from ads.车系版型辅助表 t2 where car_type_code = t2.辅助字段 ),
car_type_code= (select 版型code from ads.车系版型辅助表 t2 where car_type_code = t2.辅助字段 )
where true; 

5、生成uuid

Hologres中GEN_RANDOM_UUID函数如何使用_实时数仓Hologres-阿里云帮助中心 (aliyun.com)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
东南亚位于我国倡导推进的“一带一路”海陆交汇地带,作为当今全球发展最为迅速的地区之一,近年来区域内生产总值实现了显著且稳定的增长。根据东盟主要经济体公布的最新数据,印度尼西亚2023年国内生产总值(GDP)增长5.05%;越南2023年经济增长5.05%;马来西亚2023年经济增速为3.7%;泰国2023年经济增长1.9%;新加坡2023年经济增长1.1%;柬埔寨2023年经济增速预计为5.6%。 东盟国家在“一带一路”沿线国家中的总体GDP经济规模、贸易总额与国外直接投资均为最大,因此有着举足轻重的地位和作用。当前,东盟与中国已互相成为双方最大的交易伙伴。中国-东盟贸易总额已从2013年的443亿元增长至 2023年合计超逾6.4万亿元,占中国外贸总值的15.4%。在过去20余年中,东盟国家不断在全球多变的格局里面临挑战并寻求机遇。2023东盟国家主要经济体受到国内消费、国外投资、货币政策、旅游业复苏、和大宗商品出口价企稳等方面的提振,经济显现出稳步增长态势和强韧性的潜能。 本调研报告旨在深度挖掘东南亚市场的增长潜力与发展机会,分析东南亚市场竞争态势、销售模式、客户偏好、整体市场营商环境,为国内企业出海开展业务提供客观参考意见。 本文核心内容: 市场空间:全球行业市场空间、东南亚市场发展空间。 竞争态势:全球份额,东南亚市场企业份额。 销售模式:东南亚市场销售模式、本地代理商 客户情况:东南亚本地客户及偏好分析 营商环境:东南亚营商环境分析 本文纳入的企业包括国外及印尼本土企业,以及相关上下游企业等,部分名单 QYResearch是全球知名的大型咨询公司,行业涵盖各高科技行业产业链细分市场,横跨如半导体产业链(半导体设备及零部件、半导体材料、集成电路、制造、封测、分立器件、传感器、光电器件)、光伏产业链(设备、硅料/硅片、电池片、组件、辅料支架、逆变器、电站终端)、新能源汽车产业链(动力电池及材料、电驱电控、汽车半导体/电子、整车、充电桩)、通信产业链(通信系统设备、终端设备、电子元器件、射频前端、光模块、4G/5G/6G、宽带、IoT、数字经济、AI)、先进材料产业链(金属材料、高分子材料、陶瓷材料、纳米材料等)、机械制造产业链(数控机床、工程机械、电气机械、3C自动化、工业机器人、激光、工控、无人机)、食品药品、医疗器械、农业等。邮箱:market@qyresearch.com

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值