基于数据仓库星形模式的广东省高速公路一张网资金结算情况分析系统

 


   基于数据仓库星形模式的广东省高速公路一张网资金结算情况分析系统

马根峰  
                             (广东联合电子服务股份有限公司  广州 510300)

摘要    星形模式是基于关系数据库的数据仓库中的一个著名概念,由于星形连接模式的设计思想能够满足人们从不同观察角度(维)分析数据的需求,所以在基于关系数据库的数据仓库的设计中广泛地使用了星形模式。本文主要介绍《广东省高速公路一张网资金结算情况分析系统》中的数据仓库技术。

关键词    数据仓库;星形模式;维度

 

 

1 数据仓库的特点

数据仓库技术是用以更好地支持企业或组织的决策分析处理的,面向主题的,集成的,不可更新的、随时间不断变化的数据集合。它通过将数据按照不同的综合程度(即粒度)来组织,以满足不同分析的需要。

本文主要介绍一下《广东省高速公路一张网资金结算情况分析系统》中如何使用数据仓库技术来实现"资金结算情况的分析"这个主题

 

星形模式

星形模式是基于关系数据库的数据仓库中的一个著名概念,由于星形连接模式的设计思想能够满足人们从不同观察角度(维)分析数据的需求,加上数据仓库通常用来回答综合性的问题,所以在基于关系数据库的数据仓库的设计中广泛地使用了星形模式,如电信运营商中普遍进行的话务总体分析。

 

 

系统中的数据仓库设计

3.1  广东联合电子结算中心操作型环境 DB2 数据库服务器下的数据组织情况

在广东联合电子结算中心, “异常流水”、“流水拆分”、“流水上传”有关的关系模式

l  粤通卡精确拆分结果明细表

      tb_cardaccuratesplitresult (流水号,工班出口路段收入路段)

l  现金精确拆分结果明细表

      tb_cashaccuratesplitresult  (流水号,工班出口路段,收入路段)

l  流水非精确拆分记录表

      tb_inaccuratesplitrecord (流水号,工班出口路段收入路段)

l  拆分流水异常记录表

      tb_outlistspliterrorgb(流水号,工班,出口路段, …,错误类型代码)

l  拆分流水异常记录历史表

      tb_outlistspliterrorgb_his(流水号,工班,出口路段, …,错误类型代码)

l  流水异常记录表

      tb_outlisterrorgb(流水号,工班,出口路段, …,错误类型代码)

l  流水异常记录历史表

      tb_outlisterrorgb_his(流水号,工班,出口路段, …,错误类型代码)

l  出口流水表

      tb_outlistgb (流水号,工班,出口路段, …,上传时间)

 

3.2  系统的中数据仓库设计

考虑到篇幅,各步骤经过简化如下:

l  概念模型设计

l  逻辑模型设计

l  数据仓库生成

3.2.1概念模型设计中的界定系统边界

在广东联合电子服务股份有限公司,管理者最迫切进行的分析目标主要有:

l  各高速公路路段公司不同工班的流水上传、流水拆分。

l  分析各个高速公路路段公司上传的异常流水(包含异常及拆分异常)、及其修改的情况;

 

要进行以上的分析,所需数据应包括:

l  分析各个高速公路路段公司在一段周期内的流水上传、拆分、异常总量、异常修改情况。

l  分析各个高速公路路段公司上传的异常流水(包含异常及拆分异常)、及上传的异常的流水(包含异常及拆分异常)流水的修改情况;

l  各个高速公路路段公司及他们的软件开发商

l  广东省高速公路所有的路段信息;

 

 

3.2.2 逻辑模型设计

因为细节级数据太大,数据仓库又建立在本人的PC机上 MS SQL SERVER 服务器上,加之迫于分析任务提交时间的压力,故本数据仓库中不再涉及细节级数据表的设计、数据挖掘。

 

关系模式定义:

ok_xiugai (LISTNO, UPLOADTIME, OUTROADNO, SQUADDATE, ERRCODE, ERRMSG…)

no_xiugai (LISTNO, UPLOADTIME, OUTROADNO, SQUADDATE, ERRCODE, ERRMSG…)

upload_split(路段编码路段名称工班上传流水数量拆分流水数量…)

kaifa (roadno, kaifa_name)

tb_road(areano,roadno,roadname,…)

 

3.2.3 数据仓库数据生成

数据仓库中数据的生成包括操作型环境数据的挖掘和数据仓库中数据的生成这两部分的内容。在这一步里所要做的工作是接口编程,以实现将操作型环境下的数据装载进入数据仓库环境。


 


   

 


    

 

 

4 数据仓库的数据导出与展现

4.1 万能数据库查询分析器

万能数据库查询分析器,中文版本《DB 查询分析器》、英文版本《DBQuery Analyzer》。它具有强大的功能、友好的操作界面、良好的操作性、跨越各种数据库平台乃至于EXCEL和文本文件。

你可以通过它查询ODBC数据源(包括世面上所有的数据库、TXT/CSV文件、EXCEL文件)的数据。你可以同时执行多条DML语句乃至存贮过程,结果会以你设定的表格、文本框、文件来返回。从数据库导出千万条数据时,效率与DBMS没有什么区别。

《万能数据库查询分析器》中文版本《DB 查询分析器》在中关村在线下载量超过10次,位居整个数据库类排行榜中8所以在实际工作中,本人用《DB 查询分析器》作为客户端,实现将数据仓库中的数据展现与导出。

 



   4.2 本系统中的两个分析目标的星形模式






 



   4.3 数据样例示意



6  数据展现1

 

 


7  数据展现2

 


8  点击“DB 查询分析器”的工具栏按钮,即可导出数据1

 

 


9  点击“DB 查询分析器”的工具栏按钮,即可导出数据2

 

 

 

结束语

笔者在《广东省高速公路一张网资金结算情况分析系统》的研究与开发过程中,是数据仓库技术在实际工作中的又一次运用。

 

 

 

参考文献:

[1]  马根峰 · 万能数据库查询分析器中的事务管理在Oracle中的应用· 上海:微型电脑应用2008.4

[2]  新产品&工具点评 特别推荐:“万能数据库查询分析器”发布 · 程序员,2007.2

[3]  马根峰 · DB QueryAnalyzer中的事务管理在DB2中的应用· 北京:电脑编程技巧与维护2011.22

[4]  马根峰 · DB 查询分析器》批量执行DML语句并返回更详细的信息· 北京:电脑编程技巧与维护2011.24

[5]  王珊 · 数据仓库技术与联机分析处理 · 北京:科学出版社,1998.6

[6]  MichaelCorey(),MichaelAbbey(· SQL SERVER 7 Data Warehousing · 北京:希望电子出版社,2000.1

[7]  袁鹏飞 · SQLServer 7.0数据库系统管理与应用开发 · 北京:人民邮电出版社,1999.5





 






 



 
深度学习是机器学习的一个子领域,它基于人工神经络的研究,特别是利用多层次的神经络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经络(Neural Networks)**:深度学习的基础是人工神经络,它是由多个层组成的络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经络(Feedforward Neural Networks)**:这是最常见的神经络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经络(Convolutional Neural Networks, CNNs)**:这种络特别适合处理具有格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经络(Recurrent Neural Networks, RNNs)**:这种络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗络(Generative Adversarial Networks, GANs)**:由两个络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经络中用于添加非线性,使得络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值