以政府数据治理体系建设为抓手推进国家治理现代化

日期: 2018-12-04
浏览次数: 19

自党的十八届三中全会以来,推进国家治理体系和治理能力现代化建设,作为党和国家全面深化改革总目标的一部分,是我国特色社会主义进入新的发展阶段的一个重要标志,由封闭管理向开放治理转变,是当代中国社会建设理念的升华。由单向管理向协同治理转变,由被动响应向主动服务转变,由粗放管理向精准化管理转变,是以数字化、网络化、智能化为特征的信息化和大数据时代经济社会发展的新要求。

大数据作为国家基础性战略资源,能有效地集成国家经济、政治、文化、社会、生态等领域的数据信息,为国家治理体系和治理能力现代化建设提供重要数据基础和决策支撑,是促进政务服务改革和提升政府治理能力的新途径,是实现党、国家、社会各项事务治理制度化、规范化、程序化,提高党科学执政、民主执政、依法执政水平的重要抓手。

 

深藏闺中的政府大数据现状

 

作为提高政府治理水平的重要技术支撑,大数据技术被广泛运用到政府决策、公共服务、社会监管以及社会民生保障等领域,推动着社会治理模式的创新,不断提升政府科学决策、精准服务、精细管理等水平。随着大数据的深入应用,政府数据资源日益受到重视,但是政府数据的现状却不容乐观。克强总理在2016年5月全国推进简政放权电视电话会议上指出“目前我国信息数据资源80%以上掌握在各级政府部门手里,但却‘深藏闺中’造成了极大浪费。”

政府部门受其自身业务特点和管理职责所限,信息化建设管理方式和业务数据生命周期各异自身的规律,业务碎片化与技术碎片化造就的数据碎片化问题,是政府数据“深藏闺中”的主要原因。加强政府数据资源管理,构建政府数据治理体系,成为实现政府部门数据资源的高效应用的迫切需求,政府数据治理成为了政府治理方式变革的必然趋势。但是由于缺乏系统思维和系统治理的方法,加上相关制度法规和标准规范的缺失,严重制约了政府数据发挥其应有的效用。

 

政府数据治理体系的内涵

 

数据治理(Data Governance)是组织对数据管理和利用进行评估、指导和监督的体系框架。它通过制定战略方针、建立组织架构、明确职责分工等,实现数据的风险可控、安全合规、绩效提升和价值创造,并提供不断创新的数据服务。

而具体到政府数据的治理,其目标可以概括为“科学规范管理和利用大数据”,其核心任务是推进技术融合、业务融合、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务,即解决政府数据“三融五跨“难题,解决数据的“质量问题”和“安全问题”。

政府数据治理的系统性决定了其需要考虑多元性、协同性、开放性、复杂性、安全性等特点,大数据治理体系技术支撑需要涵盖大数据质量、存储、管理、共享与开放、安全与隐私保护等多个方面。才能根本上解决政府数据汇聚交换不畅、开放共享不足、应用落地不易、安全监管不到位等问题。

 

政府数据治理的实现路径

 

作为数据治理体系建设的两个主要内容,数据质量管理和数据监管分别解决了数据价值开发与安全保护的两个问题。在华傲数据(微信:bigaudaque)看来这里既要通过大数据平台建设解决技术和业务层面的问题,同时也要加强法律法规和标准规范的建设,为数据治理体系的运转提供有力的制度保障。


(一)破解信息孤岛的数据大航海之术

传统业务驱动方式建立的信息化系统不仅造成系统烟囱林立、数据割裂的问题,而且使得不同系统之间缺乏统一的数据标准导致数据碎片难以关联融合,业务沉淀的数据质量问题突出,难以形成有效数据资源支撑应用。

如果把政府中的“五跨”数据源看成是一个一个已经被发现、有待被发现和正在建设、将要建设的小岛和大陆(这些小岛相当一部分是“信息孤岛”),“三融五跨”的时代可类比于15世纪那个将小岛、大陆用航路连接起来,建立全球贸易的地理大发现时代,现在是一个“数据大发现”时代。在地理大发现时代,早期航海者,如哥伦布,常常是“走的时候,不知道去哪儿;到的时候,不知道在哪儿;回的时候,不知道去过哪儿”。数据治理体系就是赋予数据大发现时代一个现代“数据航海术”,避免出现“哥伦布窘境”:在“五跨”数据治理体系建设中,开始的时候不知道能做啥;进行的时候不知道该做啥;完成的时候不知道做了啥。

华傲数据CEO贾西贝博士认为,政府数据资源从无到有的关键,是解决政府数据质量问题,需要有从业务驱动向数据驱动统一数据模型设计,构建全生命周期管理实现数据可循环更新的质量提升。在这一体系下建设的大数据平台,应当实现分层融合、分层治理、分层监管,以数据目录体系为海图,数据标准与数据监管体系为指南,在数据融合与数据治理平台这艘巨轮之上,构成数据大发现时代的数据治理方法指引,实现数据质量问题的自动发现和不同粒度的自主查改,辅以任务工单系统实现数据质量大循环,能够清晰定义数据清洗目标,和实现路径拒绝盲目无效的数据处理,最终形成高质量的城市级数据资源库,从而解决数据的开发利用问题。

具体而言,政务信息资源目录梳理就像地理大发现时代构建海图的过程,让我们知道哪里有大陆(数据大户)、哪里有小岛(数据资源)、哪里有暗礁(敏感数据)、哪里有冰川(难协调数据)。“五跨”特征是政务数据区别于企业数据的本质特征,由于政府是科层制的,各级别的信息化建设无法像企业那样,由一个全国统一的IT部门统筹建设运营,只能是各级别、各部门、各业务分头建设、自主演化、独立运营,这使得政务信息资源目录梳理成为一项最先需要开展的必不可少的工作,它是一项混合了数据普查和业务普查的调研工作,调研的重点是现状调研和需求调研,包括各委办局有哪些职责、哪些业务,各业务有哪些流程、哪些系统,各业务、各系统中产生和用到哪些数据,各委办局有哪些数据库,各委办局在建和计划建设哪些系统,将会需要什么样的数据。梳理过程中收集这些数据和数据库的产生系统、产生流程、数据来源单位、数据存储地、数据库类型、数据格式、数据模型、数据标准、数据更新频率、数据接口等元信息。哪里有业务暗礁、哪里有信息孤岛,在这项普查中都会被记录、刻画,最终会形成一幅城市/区域政务数据的全景图。政务信息资源目录梳理的结果会录入一个元数据管理系统中,在政务数据治理体系中,这个元数据管理系统的基础功能组成了信息资源目录。

数据标准化平台和数据监管平台就像指南针,让我们的数据治理体系不要走错方向,别走弯路、错路和邪路。数据治理体系的搭建,就像建设一个数据工厂,工厂的输入是现状数据(源数据),输出是数据资源(基础库、主题库等)和对现状数据的质量反馈、安全监管。在数据大航海中,虽然我们有了海图,但海图只让我们了解了现状数据和数据需求,我们还不知道数据加工的目标在哪里,我们的目标数据是什么样的,我们仍然有陷入“哥伦布窘境”的危险。我们更为担心的是数据加工的过程不可预见、不可控, 数据加工结果因人而异、因时而异、因事而异。所以,我们要为我们的目标数据(数据资源库)制定标准,这些标准越精细,我们的数据加工过程越可控。现状数据往往是业务导向、应用需求驱动建模的,意味着现状数据中我们看到的是一份一份社保缴纳记录、赔付记录,一个一个检验报告、病例、一项一项出生证明、居住登记、租房合同、户籍记录……而目标数据则是资源导向、通用数据驱动建模的,实质上是在数据空间里建立起对客观世界的映射,手段是在数据空间里整合对城市管理服务实体的数据描述。在目标数据中我们应该看到的是城市中的每一个人、每一家企业、每一个社会组织、每一套房、每一个城市部件、每一辆车……数据标准平台首先要解决目标数据的建模问题,包括数据编码标准、数据元标准、数据模型标准、数据存储标准、数据交换格式标准、数据共享接口标准等。其次,数据标准化平台还要解决现状数据(源数据)的逐渐标准化问题,虽然存量现状数据的模型、编码、类型、字典、格式、接口等由于系统和数据库早已建设完成,推倒重来代价巨大,但目前的智慧城市建设中正在建设、将要建设一大批新的业务系统,这些新系统将会产生大量增量数据,这些新系统在如果系统建设过程中就采用和目标数据兼容的业务数据标准,后期将会大大减少数据浪费、并节省大量数据清洗代价。所以数据标准平台需要建立通用业务数据标准、关键专用业务数据标准,并在信息化项目立项和验收过程中确保这些标准的采用。第三,数据标准平台还要解决数据加工过程的标准化问题,由于现状数据和目标数据这两头都已经标准化,由现状数据到目标数据的加工过程也可以标准化了,使得我们可以在数据工厂中推行标准化施工,构建一个系统化、标准化、智能化的“数据炼油厂”。数据加工的过程标准包括数据清洗规则标准、数据融合流程标准、数据质量评估标准等。通过目标、源、过程的标准化,我们可以确保政务大数据的征程不走弯路、不踩前人踩过的坑、不南辕北辙、不走错路。数据标准化平台不仅辅助制定标准(归纳标准、发现标准、分析标准),管理已有标准,还能够进行标准复合型测试——利用标准发现数据中的问题、查错,以及进行智能标准化——解决发现的问题、改错(主要是修正形式错误)。

数据标准平台可以解决数据治理体系中最艰巨的质量问题,数据治理体系中还有另一类重要问题,是安全问题。在信息资源目录梳理过程中,我们无死角地发现了数据在各委办局、各业务系统中的存在,作为数据治理、数据安全主管部门,如果确保确保源数据、目标数据、数据加工过程、数据应用过程不出安全问题,堵住所有的数据漏点,确保数据不大意丢失、不违法泄露、不被恶意篡改、不被违规商用,就是一个重要课题,这个是靠数据监管平台完成的。事实上,数据交易、数据运营、数据开放、数据共享都应在有效的数据监管下,才能健康有序进行,否则会在交易、运营、开放、共享中积累大量风险,在将来随着数据立法和数据政策的明晰,随时有可能爆发。就像证券交易所需要证监会监管一样,数据交易所和数据运营公司需要数据安全主管部门的监管,避免发展成互联网金融乱象一样的数据乱象。数据监管平台的职责包括数据系统的访问控制,数据操作的留痕、日志管理与定期审计,数据隐私条款的备案、审查,数据系统的评测,数据接触人员的清单管理、保密协议备案、准入准出和背景调查等,数据安全责任划分和数据保护官(DPO,Data Protection Officer)、数据治理官(DGO,Data Governance Officer)及首席数据官(CDO,Chief Data Officer)的选择与设立等。数据监管平台可以确保数据治理体系不走错路、邪路。

数据治理平台和数据融合平台是数据工厂的关键设备,它们就像轮船,数据大航海中真正的航行是由这两个平台完成的。数据治理平台就像轮船的“舵手”,掌控着轮船的行进,数据融合平台就像轮船的“发动机”,推动轮船前进。在由源数据到目标数据的加工过程中,不仅实体会重复、格式会混乱,数据也会冲突,会错误。这些错误有两种,一种是形式错误,一种是实质错误。对于形式错误,以目前的技术手段,可以进行全自动化的数据清洗,但是,对于实质错误,还不能、很多时候部门职责也不允许进行自动化的数据清洗,必须在源头业务系统或数据责任部门进行有人工干预的法定数据修改。但是,数据资源库的建设没法等待千千万万这样的人工干预,所以,除了自动发现错误、引入人工干预手工修正实质错误(系统会给出建议值)、管控源数据质量的数据治理平台之外,还需要一个不等待人工干预,在尽可能保障、提升数据质量、确保统计意义正确的条件下,后台连续不间断处理所有数据问题,在最短时间内构建数据资源库的数据融合平台。如果说数据治理平台是综合运用技术手段和管理机制治理源数据质量、对各委办局数据共享绩效进行科学考核的平台,数据融合平台则像一刻不停的数据流水线工厂,源源不断地把现状源数据提炼成目标数据资源。在整个数据治理体系中,数据治理平台是三层治理网结构的数据天网体系,数据融合平台是六层流水线结构的数据工厂体系。


(二)数据应用边界的自律与监管之道

切实保障国家数据安全。加强关键信息基础设施安全保护,强化国家关键数据资源保护能力,增强数据安全预警和溯源能力。要加强政策、监管、法律的统筹协调,加快法规制度建设。制定数据资源确权、开放、流通、交易相关制度,完善数据产权保护制度。加大对技术专利、数字版权、数字内容产品及个人隐私等的保护力度,维护广大人民群众利益、社会稳定、国家安全,俨然已成为我国建设网络强国,数字中国的迫切需要。

目前,世界主要国家和地区也加强大数据安全保障,德国的《联邦数据保护法》,加拿大的《个人信息保护法》,法国的《数字共和国法案》,美国2017年制定的《数据保护法案(草案)和欧盟的《通用数据保护条例》(GDPR)等,都先于我国做出了探索。其中欧盟出台的GDPR是要求最高,如数据被遗忘权、可携带权等,全面提升个人数据保护力度。而我国去年出台的《网络安全法》,以及刑法二百五十三条释义,都对相关情况做了约束。

当政府数据通过质量管理形成数据资源,支撑数据应用的开展的同时,就需要考虑数据的有效监管问题,没有数据监管,数据就像脱缰野马,会造成系列的安全问题。近年来,频发的信息泄露事件,特别是以Facebook的个人数据作用于竞争助选、国内互联网企业利益大数据“杀熟”等现象,越发引起国人的关注。那么作为以隐私数据为主的政务数据如何进行数据监管,特别是在探索进行中的数据运营于数据交易,更是对此提出了尖锐的挑战。如何对数据不同方向的应用提出具体的自律和监管要求,推动数据保护法的制定和落地执行,是迫在眉睫的首要问题。

华傲数据在其数据监管保护平台的设计中提出,为了实现对数据的有效监管,需要在数据治理体系中加入有关数据普查和数据登记的内容,让数据管理者实现数据情况清,数据底数明,并结合数据质量管理过程中的分层监管功能,最终实现数据安全分级、用途分类,对数据来源数量、频率作出统计,同时让所有数据操作留痕管理。在此基础上,结合数据的加工体系,输出高质量的数据粗加工成品实现交易和数据深加工形成的数据产品实现数据的运营。


结语

总而言之,政府数据治理体系的建设是涉及到国家实施大数据战略的重要基础和保障,积极引导和发展大数据产业是加强大数据核心技术开发与利用的基础,是运用大数据提升政府治理能力的动力源泉。实现数据治理体系化运转,是用好政府数据这一数据金矿的前提条件和有力保障。应该得到政府、行业组织、科研院所和从业单位的重视,形成全面的、完整的、一体化协同推进合力,让大数据为实现政府治理能力现代化提供强大的支撑。

在此背景下,由中国政法大学主办,合肥市数据资源局和中国政法大学互联网金融法律研究院(大数据与法制研究中心)共同承办,华傲数据协办的“2018(第二届)新时代大数据法治峰会暨政务数据治理会议(特邀)”将于2018年12月14-15日在合肥举办,会议以“数据治理护航数字中国”为主题,以大数据应用的法治研究为核心,以推进数据治理为宗旨,促进大数据产业和数字经济实现规范与有序发展并举、创新与风险防范并重。届时峰会将邀请对数据法治感兴趣的来自学界、研究机构、政府、企业的嘉宾、观众、媒体出席。

 

关注我们
微信二维码
Copyright ©2011 - 2018 深圳市华傲数据技术有限公司
犀牛云提供企业云服务