随着科技的进步,大数据的运用日益广泛,在大数据面前,我们每个人都是“体无遮拦”!新时代的审计工作转型,更是离不开大数据的运用,就目前审计信息化建设的阶段来说,如何高效的开展大数据比对是每一名基层信息化人员都需要思考的问题。下面笔者根据自身的经历,谈谈在大数据比对环节中比较常见的几个问题: 


 

一、采集数据不全,经常“缺胳膊少腿”。大数据比对最开始的第一步都是在被审计单位采集数据,往往审计人员在采集数据的时候出于各方面的原因大部分只采取几个字段,虽然这样会减少数据量,让思路更加清晰,但是当初在设计这些表格的时候,也是很多工程师苦思冥想的结晶,每一个字段都是不可或缺的,并且审计工作都是渐渐深入的,现在用不着,在后面的延伸阶段,那些不起眼的字段也就有用武之地。 


 

二、未分析数据,直接写语句。大数据比对讲究的就是海量的数据,面对这些海量的数据怎么找对他们之间的关系就变得非常重要,比较常见的都是运用身份证号相关联,如果有的数据没有身份证号这一字段怎么办?所以我们在拿到数据后需要先仔细的观察分析,找找数据中类似于身份证号这样的字段,做到了然于心,在审计的过程中不会因为这些事情“卡壳”!一旦“卡壳”可能审计思路就断了,在大数据比对中,把自己的审计思路顺利的转化为代码才是最重要的。 


 

三、未检查数据完整性,徒做无用功。大数据比对最显著的特点之一就是精准,要确保结果精准,对于核心字段的检查必不可少,比如身份证号是18位或者15位,不符合这个标准的数据就不能要。大数据比对后的结果是要逐条核实的,如果不把这些工作做好,就严重影响了整个审计工作的效率。 


 

四、思路过于单一,结果不具备代表性。如果说海量的数据是大数据比对的基石,那么广阔的思路就是大数据比对的框架了,思路是否开阔,决定了大数据比对成果的大小,这个思路并不是局限于分析人员本身,也可以是任何审计人员。不要因为某些审计人员不懂信息化就忽略他们的想法,相反他们才是审计经验最丰富,想法最全面的,多与他们讨论,听取他们的建议,是把大家的思路转化为代码,把大家的想法变成成果,这样运用大数据比对得出的结果才具备代表性。 


 

五、太过于看中大数据比对,忽略了数据的源头。在大数据比对中,会有很多个系统的数据,比如工商、房管、车管所等等,在这些数据与源数据比对后得出来的结果都是某某人不应该享受政策但他享受了,但是有没有运用大数据分析过那些应该享受政策的人是否按照标准享受了政策?审计是人民利益的“安全卫士”,信息化人员在运用大数据的时候既要剔除那些“害群之马”,也要考虑到政策标准是否严格的执行,惠及每一个应该惠及的人,数据关联是一部分,对源数据的分析也是不可忽视的。