大数据是一种技术,更是一种思想上的革命。要充分发挥大数据的作用和价值,就必须要用更开放的思维来拥抱大数据。仅在大气污染防治方面,一方面加大监测力度,把监测的数据开放给社会,增加公众知情权,同时也要海纳百川,可以考虑把更多的数据引入环保。
近些年,各行各业都在热情拥抱互联网+、大数据,各种信息化项目也被冠以“大数据”的名头,那么,大数据时代尤其是政府大数据时代真的来了吗?环保大数据时代来了吗?
众多业内人士认为,目前政府大数据时代还没有真正到来,这是一个循序渐进的过程。对于大数据来说,现代的数字技术、计算技术、存储技术、传输技术、网络技术等确实为大数据时代的来临奠定了基础,但相比于技术问题,更重要的是与大数据时代相应的机制体制问题。
国家层面上虽然已经印发《促进大数据发展行动纲要》,但这并不意味着政府大数据时代来了,而是旨在提升政府数据意识,构建数据文化,迎接和拥抱大数据的来临。政府的大数据目前来源于各部门数据整合,要整合数据就要触及系统,也要触及业务及其业务部门,由于触及相关部门的利益以及话语权等,客观上就需要进行机制体制的改革,建立新的利益共同体。
正如“十三五”规划所提出的“创新、协调、绿色、开放、共享”五大发展理念,要治理环境污染,基于大数据思维的创新必不可少,而在环境管理创新方面,众多业内人士认为应该注意以下关键点,即“开放、共享、标准、融合”。
开放
——开放的态度实现创新思维
大数据是一种技术,更是一种思想上的革命。要充分发挥大数据的作用和价值,就必须要用更开放的思维来拥抱大数据。在大气污染防治方面,一方面加大监测力度,把监测的数据开放给社会,增加公众知情权,同时也要海纳百川,可以考虑把更多的数据引入环保。
政府投入的力度再大,人力、物力和财力都是有限的。因此,除政府部门搭建公共空气质量监测平台外,可以通过建立适当的机制,引导和鼓励企业或个人监测的设备加入环保监测网络,作为监测的有力补充,在符合一定条件下,向公众发布。可以想象,未来如果有大量的可穿戴式装备和车载空气监测设备接入到“泛空气质量监测网络”中,可以大大缓解现在空气质量监测点密度不够的问题,也能解决如移动源难以监测的问题。
当然,这些监测数据在准确度上可能有较大的差距,这可以通过大数据的手段进行处理、提升或校正。问题的关键在于如何在大数据时代,用更加开放的态度来实现创新思维。
共享
——共享的模式激发创新活力
污染防治不是一个区域、一个部门所能完成的,尤其是大气污染防治,其区域性、复合型特征日益明显,这对数据共享的要求日益迫切。而数据资产的独特美就在于,一份数据可以以非常低的成本为多方所分享、使用,而且不减少数据拥有者的价值。
在大数据时代,数据是“石油”一样的资源,一方面是因为其宝贵,另一方面数据的流动才会产生巨大的价值。在“互联网+”浪潮下,通过数据共享可以迅速创造更大的经济价值和社会价值。但现在很多环保数据虽然开放,但获取的成本很大,还没有形成长期共享、合作的机制。
因此,首先应该在环保部门内部打破业务、区域条线的限制,打破部门存在的“数据保护主义”,消除数据共享后对本部门、本区域的地位、利益、声誉等影响的顾虑,打破数据“割据”局面,创新机制和管理模式。只有数据共享,真正形成大数据,才能最大程度释放大数据的作用。
此外,社会、企业也是环保创新的主体,在环保部门之外,更应建立与社会、企业进行数据共享的保障机制。由于大气污染成因的特殊性和专业性,社会或企业难以承担大范围基础数据的采集的成本(尤其是气象、遥感、地形及大范围高分辨率空气质量数据等),从而一定程度上抑制社会和企业创新的活力。如美国政府就不遗余力地将大量基础数据向社会免费共享,并且都要求数据是机器可读的,这无疑大大降低了企业和个人获取这些数据的成本,同时要求很多政府支持的科研项目成果以机器可读的方式向社会公布,形成了“政府搭台,社会、企业唱戏”的布局,极大地释放了社会和企业的创新动力。
标准
——标准规范打破创新壁垒
环境污染防治是一种典型的跨行业、多类型的大数据综合业务应用。标准规范的不统一,使得系统和系统之间难以“对话”或“对话”的成本很高(要开发很多转换接口),数据难以真正流动起来。
目前,在环境保护部的组织下,业务方面已经出台了多个业务标准和规范,如《环境空气质量监测规范(试行)》、《环境空气质量评价技术规范(试行)》、《环境空气质量指数(AQI)技术规定》、《环境空气质量预报预警方法技术指南》、《大气颗粒物来源解析技术指南》等,这在一定程度上使业务实现了标准化。
但环保数据的标准化还面临着较大挑战,如当前环保业务应用的数据类型就高达几十种,来源于不同的数据生产部门,其组织管理方式、标准、参考体系也各不相同,给环境大数据的快速形成与综合应用提出了挑战。
因此,很多地方存在这样一种情况,虽然很多数据已经集中到了“数据中心”,但还是难以快速形成应用和分析,原因就在于这些数据来自于不同部门,遵循了不同的数据标准,这些标准在各部门内部数据组织管理上发挥了积极作用,但它们往往划分方式不统一,尺度不统一,编码不统一,给环境大数据的跨部门检索、整合与共享带来了困难。要使得数据真正能够相互关联,实现多源异构环境大数据的一体化组织方法,打破创新壁垒,统一的数据模型和数据标准必不可少,也是现阶段环保大数据要迫切解决的瓶颈之一。
融合
——认知计算提升创新价值
大数据不等于大量数据,也不等于很多种数据。大数据的魅力在于数据之间的关联、融合,从而找出新的洞察,为决策提供科学依据。大气污染防治过程中,每天会遇到大量的数据,以空气质量预报预警为例,就要综合气象背景场数据、地面气象观测数据、空气质量实测数据、卫星数据、交通数据等。这些数据简单放在一起,并不能给出一个科学合理的预报结果,只有通过模型(无论是数值预报模型还是统计预报模型)将这些数据融合在一起,才能得到真正预期的结果。因此,数据简单堆在一起不会创造更多价值,必须将数据与数据进行融合,才会达到1+1>2的效果,创造更大的价值。
以卫星遥感数据的融合为例,区别于现有基于专业人员主观判断的“看图说话”式的卫星数据分析方式,它可以自动识别海量的卫星数据,以机器学习的方式,将数据自动融入到模型的大数据客观分析中,对地面站点数据实现交叉验证,填补或修正地面数据在空间连续性、稳定性和准确度上的不足;另一方面,它可以动态监测各类污染源的实时变化,从而动态更新排放清单,获得更加准确的空气质量预测结果。
大数据是一种新的思维方式,在环境保护尤其是在环境污染防治中,大数据创新应用的重要性也日益突出。科学认识大数据,提高数据意识、发展数据精神、理解数据实质,从环境大数据中发现新知识、创造新价值、提升新能力、形成新业态。用开放的态度实现创新思维,用共享的模式激发创新活力,用标准规范打破创新壁垒,用认知融合提升创新价值,促进环境管理创新。