TPC-DI: The First Industry Benchmark forData Integration

翻译 2017年01月03日 13:54:25
TPC:事务处理性能委员会

小型的数据集成:一系列定制化的程序,数据库的存储过程实现。
中大型数据集成:使用通用的数据集成工具

两种load进程:
historical load:load所有数据

incremental update:插入、更新、删除数据

源数据模型:
CDC(change data capture),距上次修改过的数据,

HR system,包括人员信息,在historical load中一次读进来

CRM system,用户-账户信息,OLTP源,使用historical load

prospect data:潜在客户信息,有可能与现有重复

finwire data:每三个月的数据放在一个文件中

reference data:参考的数据,比如汇率信息,税率等


目标数据模型:
暴风雪结构(整合了雪花结构(整合了星型结构))


数据集:人工数据和真实数据混合


执行规则:
两种执行规则:历史加载,周期增量更新


评价指标:
为了保证结果长期有效,并且不会出现不同维度的比较,定义了一个整体性能评价标准,和一个价格性能评价标准

执行时间是历史加载和周期增量更新的几何平均,看待大数字和小数字一样,100到90和10到9一样。 

相关文章推荐

TPC-H Benchmark

关于TCP-H benchmark The TPC-H Benchmark is a popular one for comparing database vendors. It's possi...

一步一步学习ASP.NET MVC3 &EF Code First CTP 5&DI(一)

一,摘要 本篇文章我们将使用ASP.NET MVC3,Razor,EF Code First创建Web应用程序.覆盖Unity2.0,泛型Repository以及EF Code First的工作单元...

ZOJ 1051 A New Growth Industry

A New Growth Industry Time Limit: 2 Seconds      Memory Limit: 65536 KB A biologist experime...

zoj 1051 A New Growth Industry

正确代码: #include #include #include using namespace std;  int main() { int n; cin >> n; int day,to...

Codeforces Round #189 (Div. 1) Kalila and Dimna in the Logging Industry 斜率DP

题目链接:http://codeforces.com/problemset/problem/319/C

ios绘图教程(原文http://www.cocoachina.com/industry/20140115/7703.html)

Cocos开发者平台Cocos引擎中文官网H5小游戏编辑器 退出chengtanze 首页资讯问答论坛Cocos2d-x开发者中心 新手入门专题新闻日历 ...

IEEE/ACM ASONAM 2014 Industry Track Call for Papers

IEEE/ACM ASONAM 2014Industry Track Call for Papers Beijing China August17-20, 2014 Home Page: www....

zoj1051--------A New Growth Industry 细菌~

把数组中的一个数,与其上下左右的四个数相加,得到的数值对应到DNA序列里面的对应数,把这个对应数加到原数组的对应位置, 然后超过三的为3,低于零的为0,处理后,即为一天的变化情况。 比如: 3 ...
  • zzukun
  • zzukun
  • 2012年07月31日 16:12
  • 979
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:TPC-DI: The First Industry Benchmark forData Integration
举报原因:
原因补充:

(最多只允许输入30个字)