通过一个客观的例子看一下政府的数据到底是怎样治理的。最后是达到数据的目标,也就是非常清晰的张三这个人的人口信息(户籍、性别、年龄),这个数据从数据源来说,我们可以从公安、民政、街道多个维度获取,这些数据汇集过来以后面临一个什么问题呢?就像三个人坐在一起聊天,你讲中文,我讲英文,他讲法文,说不到一起,我们要解决数据标准的问题。只有数据标准统一才能做下一步的工作,在标准化以后发现,这些数据统一起来,我们要把“张三”这个人识别出来(三个部门识别出来)。然后我们发现数据有一些冲突,在户籍、公安、民政和街道都不一样,那怎么解决呢?我们要对数据确定一个权责的单位,也就是到底采信谁的数据。我们还有其他的原则:新鲜度原则和最大最小值原则,我们采取一个确信的数据来源,这样得到准确的“张三”的数据。
这个过程是非常复杂的,大家去做也因人而异,因时而异,如何做到标准化呢?其实最常用的手段就是技术架构,在企业里面解决战略问题和企业问题时往往也会从业务架构、技术架构、信息技术、应用架构几方面去解决,数据治理应该用什么样的架构?华傲和华为形成了一个联合的解决方案,在政府的数据治理上结合了DAYU的产品和实施的技术形成了这样一个架构,实现了整个数据从采集到进入数据湖形成数据底座的过程,数据底座里的数据可以通过业务流程关联,通过数据对象关联起来。数据湖建立起来后,数据可以打标签、定指标,以及基于一些算法形成数据的模型。
从而,在数据湖的基础上形成数据服务,数据服务形成政府的分析能力,政府以此来做数据化的运营、业务流程的提升、决策分析和实时数据的可视化呈现。最后形成数据资产,包括元数据、数据地图、数据指标等业务对象的沉淀,这些资产是数据作为基本生产要素的体现。有了这样一个工具后,我们还要有一个实施的过程,在实施的过程中也需要开发架构的规范化,我们把它分成六层:贴源层、标准层、原子化、整合层、主题层、安全层等等,基于这个架构就可以方便政务数据的治理了。前面谈到了有什么工具和什么架构,其实对于一个项目来说还是远远不够的,就像应用系统的开发,我们有Java这样的工具,也有DevOps开发流程的管理,这样可以交付给客户一个满意的系统。对于数据开发也是一样的,有了DAYU这样一个工具,我们也需要一个数据开发流程管理的办法,我们把这个办法叫做DtOps。这个实施方法论要解决数据开发的诸多问题比如如何去定源。确定了源头数据之后,我们怎么保证满足客户各方面的需求,由杂乱的需求变成有序的需求。确定源头数据,也有了数据需求之后,就是解决数据开发的中间过程的问题了。从源头开始,通过规范中间开发过程来保证目标的实现,这个数据开发的过程我们叫做DtOps。