随着网络的发展,我国的审计事业步入了计算机审计时代,这样以来大大提高了审计工作的效率。在实际审计过程中,审计人员还要转变自身的审计分析思路,要打破传统的审计模式,能够运用系统论的思维,以全局的观点、联系的观点,把握事物的总体和各部分之间的联系,从而发现其中的规律。可以借助于一种数据分析工具——数据挖掘技术,它能够帮助审计人员从海量数据当中,发现数据背后潜在的联系和规律。
数据挖掘(DM),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中的、人们事先不知道的、但又是潜在的、有用的信息和知识的一种过程。通过数据挖掘,不但可以来完善、丰富数据库,也为用户决策提供数据支持。常用的技术有以下几种:关联分析的目的是为了找出数据库中隐含的关联规则。分类对数据概念的描述建立模型,再用这个模型来进行分类,生成一系列的分类规则,用于对其他的数据进行分类,从而更好地理解数据库中的内容。
预测就是找出历史数据之间的变化规律,建立相应的模型,可以获得当前数据的未来变化趋势,所具有的属性值的范围、种类和特征等。常用的策略是回归分析法。聚类是一个将数据集划分为若干组或类的过程,类似于人们常说的“物以类聚”。数据库中的数据之间存在着很多异常的情况,称为偏差。这些偏差包括很多潜在且有用的知识,如分类中的反常实例、模式的特例等。在实际审计过程中,选择合适的挖掘技术能给审计工作带来很大的帮助,而且不同的挖掘技术应用的对象也不同。
从审计角度来看,数据挖掘就是根据事先明确的审计目标,对被审计单位的大量业务数据进行分析,揭示其中潜在的逻辑关系和规律,并进而形成明确且有效的审计思路的过程。数据挖掘技术在审计中的应用价值,主要体现在可以依据其发现的知识来构建审计分析模型,将其运用到实际的审计业务中,可以大大提高审计工作的效率。比如,通过对银行信用卡恶意透支的历史数据进行数据挖掘,可以发现“信用卡恶意透支与信用卡客户的收入状况、平均消费额、职业、年龄等客户属性之间的联系”这类知识,以此为基础构建出相应的审计分析模型并运用到被审计银行的当前信用卡业务数据中,审计人员就可以快速确定审计重点。
一般来说,数据挖掘技术在计算机审计中的操作步骤主要有以下几步:指的是要明确审计时需要发现什么信息、解决什么理由。这个定义驱动了整个数据挖掘的过程,是整个挖掘过程的基础,也是检验最后结果的依据这个环节包括数据采集、数据清理和数据预处理三项内容。数据采集要尽可能地采集所有与需要解决的审计业务理由密切相关的数据。数据清理将采集到的数据经过数据清理形成审计中间表,这些审计中间表就成为数据挖掘模型的实例数据集。数据预处理工作首先进行数据集成,整合来自不同数据源中的数据,然后从集成的数据库中选择性地提取用与挖掘的数据,最后再对选择的数据进行投影、归一化变换等处理,方便进行下一步的数据挖掘。
设计人员(包括经验丰富的审计人员)对预处理好的数据进行分析,选用合适的数据挖掘技术和策略,生成适合挖掘的数据模型。模型建立的好坏关系到数据挖掘结果的正确与否,可以说是整个挖掘过程的核心。模型不是一成不变的,需要经过反复的修改调整,最后才能成为适合当前的审计任务要求的挖掘模型。
利用建立好的模型,进行数据挖掘,输入相关审计数据,会得到具体的结果,或者数据间的规律。审计业务人员要根据这些结果,对模型以及模型的输入参数值进行多次的修正和完善,以利于得出正确的挖掘结果。将挖掘模型最后得到的正确的结果,提供给审计人员。审计人员根据审计任务要求和被审计对象的特征来分析得到到的挖掘结果,得到明确有效的审计思路,从而得出正确的审计结论。有些结果可能会为发现审计理由提供线索,审计人员可以根据这些线索进一步地追查相关的资料,发现理由所在。
虽然数据挖掘技术在计算机审计应用,还处于初级阶段,还需要进一步的研究,不断地探索和完善。但是我们也看到了它在计算机审计领域的优势。在教育、金融、企业、经济责任等各行业的审计工作中,面对庞大的、复杂的数据库,使用数据挖掘技术,可以让审计人员在审计过程中迅速把握总体,从海量数据中根据需要找出有用的知识信息以及数据间潜在的规律和联系,进一步提高审计工作的效率,并为领导的正确决策提供数据支持。
举报/反馈