隐藏按钮
开课吧企业服务客服
开课吧企业服务联系电话
开课吧企业服务市场部二维码

数据治理的工作都做些什么

2022年2月25日 18:36

我们在进行大数据应用完成中台梳理工作之后,就要轮到我们业内号称“又脏又累又不出活”的数据治理出台了,虽然这项工作看似不出效果,但是它却有着十分重要的意义。我们就从流程上来看一看这个“又脏又累又不出效果”的工作都做些什么。



1,数据接入

在数据治理的这项大工程里边并不是说一次就可以把所有的数据接入并治理好而是一个业务与技术相互促进的动态发展过程中。但是在中台建设完成后就是要接入数据,不然中台就很有可能是一个空架子。一般而言接入的数据是多源异构。简单来说就是多个数据源,不同的数据存储架构。


2,数据清洗

当接入数据之后会先给它起一个名字,叫元数据。而元数据若在实际生产中得以应用就需要对元数据进行一定的处理。清洗是相对于脏数据来说的还有一大堆的名词,比如格转,缺失值管理等等。这一过程统称为叫ETL,也就是数据的抽取转换与加载。


3,数据资源池

经过前两步数据基本上达到了可以使用的地步了。进入到数据资源池中相当于数据成为了一种资源价值又上了一个层级。 在数据资源池中在逻辑上又分成了五个库的概念,代表着数据治理一步步向业务走与业务结合的过程。


上边三步过后数据质量也较之前有了很大的提高,但数据治理工作并没有真正的完成。这时的数据服务就起到了重要作用,很多时候我们治理工作看似没有效果的原因就是没有重视数据服务工作。数据服务的种类有很多,形式也是在随着客户的需求而不断变化,但可以发现服务在未来的比重会越来越高。产品是一方面而好的服务及服务理念又是决定数据治理成败的关键。