编辑:
2015-12-22
(1)数字频率的上限:
(2)数字频率的下限:
1.1.4Benford法则的应用范围
(1)可以针对海量数据进行挖掘分析,数据规模越大,分析结果越精确。
(2)会计舞弊调查[3-5]、审计[6-8]、税收监管[9]、金融分析和反洗钱[10]。
1.2Apriori算法简介
Apriori算法[11]是一种对布尔关联规则频繁项集进行挖掘的算法。Apriori算法使用一种逐层搜索的迭代方法,即使用k-项集用于探索(k+1)-项集,其中k=1,2,3,…,n,n∈N,直到最终无法找到频繁(k+1)-项集,从而确定最终的频繁k-项集。
2应用Benford法则和Apriori算法对海量数据的审计分析
Benford法则和Apriori算法的联合数据挖掘在审计中的应用主要围绕为以下两个核心步骤展开:
2.1应用Benford法则发现审计疑点
(1)判断数据的来源是否符合Benford法则的应用范围。
(2)对总体数据的一、二位有效数字进行Benford法则的符合性测试,初步发现对数据进行深入钻取的线索。
(3)对标准分布频率和实际分布频率进行比较,分析频率偏差,确定合理的钻取重点。
(4)根据分析结果和实际需要,进行更多位数字的进一步数据钻取和分析,直至发现目标数据。
钻取过程如图1所示。
2.2 应用Apriori算法分析审计疑点
(1)采集通过Benford法则分析后输出的疑点数据集。
(2)整理疑点数据集以建立事务集,即Apriori算法要求输入的数据集合。
(3)扫描事务集产生候选数据集合,并依据最小支持度筛选出频繁项集。
(4)频繁项集进行自关联,迭代第三、第四步,确定最终的频繁项集。
(5)依据最小置信度从频繁项集产生强规则。
(6)对强规则进行人工审计业务分析。
3应用案例
3.1应用Benford法则对审计疑点的发现过程
3.1.1 确定审计数据和目标字段
分析某企业的凭证数据,从其记账凭证表accvouch摘取字段结构如表1所示:
3.1.2 数据导入
将相应的目标数据表导入审计人员使用的数据库。 3.1.3总体频率计算
3.1.3.1 数位的选取
以凭证T2000001和T2000002为例解释数位选取方式,如我们选取凭证编号T2000001的金额栏1 000元的第一、二位数值为”10”,作为该笔记录的第一、二位数;我们选取凭证编号为T2000002的借方金额栏3 029元的第一、二位数值为”30”,作为该笔记录的第一、二位数,如表2所示:
3.1.3.2 数位分析
对记账凭证表accvouch中的借方金额字段前两位进行分析,第一、二数值为10的凭证纪录有540笔,全部记录有10 149笔,因此第一、二位数为”10”频率为5.3%(540/10 149)。部分结果如图2所示。
3.1.4 分析频率偏差
根据Benford分布的数字频率上限、数字频率下限和分布概率Z统计量的公式计算得到图2所示数据。
分析图2数据可以得出:
(1)第一、二位数为”10”的实际频率为5.3%,高于Benford法则的理论上限4.53%,计算其Z统计量的值,Z值为5.844 4,也大于1.96,因此我们初步判定存在错误、潜在舞弊行为或者人为的偏差。
(2)第一、二位数为”11”的实际频率为3.25%,低于Benford法则的理论下限3.4%,虽然Z值为3.038也大于1.96,但可能是由于数位为”10”超过Benford法则的理论频率过大从而导致其频率偏低,因此应该属于无异常。
3.2应用Apriori算法对审计疑点的关联规则挖掘
3.2.1获取并整理疑点数据
为了进一步明晰数据间的关系,观察数据的规律性,对疑点数据(首一二位数为“10”)通过关联查询筛选出来,形成审计中间表,部分数据如表3所示。
3.2.2运用Apriori算法探索关联规则
步骤一:以表3中的第1列、第3列、第4列和第5列数据建立事务集D,由D建立候选1-项集C1,部分数据如表4所示。
步骤二:假设最小支持记录数为100,将支持度不足的项去掉,得到频繁1-项集L1,如表5所示。
步骤三:循环步骤一和步骤二,得到最终的频繁3-项集L3,如表6所示。
步骤四:根据最终的频繁3-项集L3和设置的最小置信度100%得出表7所示的强规则。
步骤五:由业务审计人员确定强规则的业务价值,进行人工排查后,确定编号为1的强规则为有意义的规则。
编辑老师在此也特别为朋友们编辑整理了10000字审计论文。更多详情请点击会计审计。
标签:审计论文
精品学习网(51edu.com)在建设过程中引用了互联网上的一些信息资源并对有明确来源的信息注明了出处,版权归原作者及原网站所有,如果您对本站信息资源版权的归属问题存有异议,请您致信qinquan#51edu.com(将#换成@),我们会立即做出答复并及时解决。如果您认为本站有侵犯您权益的行为,请通知我们,我们一定根据实际情况及时处理。