参加审计数据分析师培训学习体会
跨过一道小铁门,就来到这方净土:笔直的水泥路向远方延伸,两排高低的法桐,掩映出立体空间效果;三两个背着书包的学生信步前行,偶尔一辆小黄车,造型和色彩牵引着目光去追寻它的背影;午间课后极具人气,大路小径转眼间涌满了人,去食堂、进超市、回宿舍,摩肩接踵,人声鼎沸,喧而不闹。这就是这次湖北省审计数据分析师培训(试验班)所在地——华中科技大学东校区,38天的学习时光就在这里度过。
一、学习是轻松而充满悬念。突入大数据时代,很多文章、多种场合都在大肆宣传大数据创造的价值和带来的便利。欣喜之余稍微反思一下,“雾里看花、水中望月”可能是大多数人对大数据的感觉。这么智能、如此神奇,是怎么做到的?尤其是身边没有感觉到什么高科技、新方法,仅仅跨入大数据时代就有了如此多成果?我带着这些疑问和好奇,在幽静的校园里,伴随着专业老师的讲解,用一个多月时间专心探求大数据的前世今生,来一场轻松而有悬念的“溯本”之旅。
二、学习是解惑且充满斗志。乍看课表:统计学、数据挖掘和Oracle数据库?这些多年之前就存在的技术(课程),能和大数据有啥关系呀?不解之中上了数据挖掘课程,在SPSS中点击两下鼠标,对输入的男女年龄、身高、体重的相关性做出了数学判断,操作过程的输入似懂非懂,结论中的残差、P值不明所以。持续不解中上了统计学课,概率?有印象;随机变量?可能是这样吧;各种分布、密度函数?似乎还有一个很模糊的记忆;假设检验?方差分析?线性回归?……只能用一个词来回应这些问号,知耻后勇!忘记的再捡回来,不会的就认真学会,为了剖析大数据,学习的激情昂扬。
三、学习是成长并充满希望。随着统计学课程的学习、基础理论的储备,假设检验、方差分析已知其所以然,线性回归、多元分析也有入门级的知然,回头看数据挖掘之始的困惑,不仅发现残差、P值、R2,都已不再是问号,而且有了深一步的实践:使用频繁项集进行数据挖掘,使用决策树、神经网络、支持向量机对不同类型数据进行分类、验证和预测,使用k-均值、k-中心值进行聚类分析,并能在一定程度上对各种模型的功效进行统计学的解读。
四、学习是开始又充满挑战。经历了初始之惑、理论之学、算法之基、工具之效,回头看数据挖掘的意义,从数据中挖掘知识,或者说是数据中的知识发现,也是在日积月累的各种数据中进行某种“搜寻”——以统计学理论为基础,综合多种信息技术,找出真正感兴趣的模式,形成知识表示。所谓“事有必至,理有固然;物之所存,道则在焉”就是这个道理。原始数据保存了大量的事实,其中蕴藏着“必至”和“固然”,在可以达到的计算能力下,使用多种方法发现这些“必至”和“固然”,就是发现了“知识”!有了“知识”就可以用其去预测将来的结果、对未知对象做出合适的分类,达到以不变应万变的效果。关联信息之间的比对分析,是信息时代数据应用的一条道路,也是数字化审计的一个重要武器;数量大、种类多、更新快的大数据时代,用足够的原始素材,支持世界进入知识发现的“新”阶段,也推动数字化审计开始使用数据挖掘的方法。作为大数据时代的审计人员,需要结合两种方法,取长补短,敢用、活用新的工具,尤为重要的是能够对结果做出合理的解读与判断。这可能映射了大数据时代的部分实质。
夫功之成,非成于成之日,盖必有所由起。以此文纪念此次培训并开启我的审计大数据探索之路。