多源信息协同:城市和区域级大数据的应用与演进
上QQ阅读APP看书,第一时间看更新

1.2 城市大数据与新一代信息技术应用

1.2.1 全球加速迈入大数据时代

随着科学技术的进步和人类社会信息化进程不断推进,数据产生成本的下降、投资规模的增加和数据存储能力的增长,使人类所面临的数据量呈现出前所未有的爆炸性增长。

1.无所不在的数据增长源

不知不觉中,数据增长源已遍布我们每个人的周围:

• 社交网络、电子商务网站、视频网站等互联网应用和服务产生了大量数据。2011年被创建和被复制的数据总量为1.8ZB(1ZB=1024EB),远远超过人类有史以来所有印刷材料的数据总量(200PB)。例如Facebook每月上传的照片超过10亿张,每天生成300TB以上的日志数据;淘宝网会员超过3.7亿人,每天交易数千万笔,产生约20TB数据。

• 物联网和移动计算蓬勃发展产生规模更加巨大的数据洪流。预计至2020年,全球将有500亿个终端感知设备连入互联网,产生的流数据量将十分惊人。

• 科学研究(如基因组学、天体物理学和脑科学等)也产生了大量数据。例如,用电子显微镜重建大脑中的突触网络,1立方毫米大脑的图像数据就超过了1PB。

IDC认为,全球数据增速符合大数据摩尔定律(又称新摩尔定律),大约每两年翻一番。预计到2020年,全球数据量将达到35ZB,年均增长率则超过了40%,是2010年的29倍,如图1.1所示。

图1.1 2005-2020年全球数据量及预测

庞大的数据量及其处理和应用需求催生了“大数据概念”,也预示着大数据时代的来临。按维基百科的定义,大数据是指规模巨大到无法通过目前主流软件工具在合理时间内实现获取、管理、分析挖掘的数据。大数据概念是数据对象、技术与应用三者的统一,其基本特征包括四个方面(即通常所说的4V):数据规模巨大(Volume),数据类型繁多(Variety),数据处理速度要求快(Velocity)、数据价值密度低(Value)。

2.全球数据的分布与增长

根据2012年12月IDC发布的数据,美国拥有全球最多的数据(32%),其次分别为西欧(19%)、中国(13%)和印度(4%)。全球其他国家和地区拥有剩下的32%,与美国一国所拥有的数据量大致相当。全球数据地理位置分布如图1.2所示。

图1.2 全球数据地理位置分布

(资料来源:IDC's Digital Universe Study,sponsored by EMC)

基于互联网资源和技术优势,美国已具备对全球网络空间的监视控制能力。斯诺登披露的“棱镜”计划,缘于美国政府的“星风”监视计划。2004年,布什政府通过司法程序,将“星风”监视计划分拆成由国家安全局执行的4个监视计划,除“棱镜”外,还包括“主干道”、“码头”和“核子”。其中,“棱镜”用于监视互联网个人信息;“核子”则主要负责截获电话通话者对话内容及关键词;“主干道”和“码头”分别对通信和互联网上数以亿兆计的“元数据”进行存储和分析。“元数据”主要指通话或通信的时间、地点,使用的设备及参与者等,不包括电话或邮件等的内容。

根据麦肯锡全球研究中心2010年的数据,全球新增数据量地理分布如图1.3所示。

图1.3 全球新增数据量地理分布

(资料来源:IDC storage reports; McKinsey Global Institute analysis)

我国拥有全球第一的人口数、互联网用户数和移动互联网用户数,数据存量和潜在增量位居世界前列。互联网和各行业信息化系统经过多年发展沉淀下来的数据量已经十分庞大。2012年,中国的数据量为364EB,占全球13%,仅电信、金融、医疗、文化等国家重要基础数据总量就超过900PB。2013年1~9月,我国移动互联网接入流量累计完成927PB,同比增长67.3%;2012年淘宝网每天交易数千万笔,单日数据产生量超过50TB;百度存储网页数量已接近1万亿页,每天处理60亿次搜索请求,每日新增数据10TB,处理数据超过100PB;上海证券交易所每秒处理近9万笔业务,每日成交3亿笔以上;中国联通用户上网记录每月1万亿条,产生数据300TB。

未来,随着制造业升级改造不断推进,金融、交通、电信等重点行业和医保、社保、海关等重要领域的业务数据不断集中,我国数据存量将持续快速增长。预计到2020年,仅中国就将产生全球21%的数据,数据量超过8ZB,年均增长接近50%。

1.2.2 城市计算与城市大数据

以物联网、云计算等新一代技术为核心的智慧城市建设理念,已成为一种未来城市发展的全新模式,也是当前全球城市发展的热点。智慧城市是人类社会发展的必然产物,智慧城市的建设有利于解决城市发展问题,提升城市信息管理水平,促进国家高端产业发展。城市计算是智慧城市背景下,城市化与信息化结合的一个新兴领域。在对城市计算的概念进行界定之前,首先对与城市计算相关的新一代信息技术进行定义。

(1)物联网:指通过射频识别(Radio Frequency Identification, RFID)、红外感应、卫星定位、激光扫描、视频监控等信息传感设备,按照约定的协议,把物体与互联网连接起来,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络或智慧管理环境。物联网是在互联网基础上的延伸和扩展,具有技术融合度高、产业链条长、应用领域广等特点,一般包括信息的采集(“感”)、传输(“传”)、分析(“知”)、应用(“用”)等多个环节。

(2)云计算:是一种基于互联网的软硬件服务模式,旨在通过最小的管理代价和可配置的计算资源(如服务器、存储器、网络、应用、服务等)为用户提供快速、动态易扩展的虚拟化资源服务。用户只需有简易的终端设备,即可使用浏览器进行身份验证后应用软硬件服务(桌面系统、开放平台、应用系统等),软硬件及数据都在云计算中心。云计算的效率和低成本服务传递优势从技术实现层面为智慧城市的数据中心建设提供了良好的解决方案。

(3)关联数据技术是一个语义网技术的最佳实践,它采用资源描述框架(Resource Description Framework, RDF)数据模型,釆用统一资源标识符(Uniform Resource Identifier, URI)命名并生成实例数据和类数据,在网络上进行发布和部署后能通过超文本传送协议(Hypertext Transfer Protocol, HTTP)获取,构建数据互联与人机理解的语义环境。

城市计算的内涵在于将城市空间中的每个传感器、设备、人、交通工具、建筑物、道路等都当作一个单元去感知城市动态,协同完成一个城市级别的计算以服务于市民和城市。城市数据是多样性和动态性的。例如以城市中的出租车为单元,可以基于出租车速度的分析挖掘道路上的交通热点,基于出租车GPS轨迹数据分析,进行两地间的通行时间与费用预测、最优路径选择和道路规划问题评估等;结合城市中的市民在医疗、社交等各个方面的行为数据,通过城市计算提供流行病预警与趋势分析、旅游推荐和广告投放等服务。

城市计算旨在通过城市感知、数据挖掘、智能提取、改善服务四个环节形成的循环过程来智慧型地提升市民生活和城市环境,以及通过整合交通流量、人口流动、地理和地图数据、环境、能源消耗、人口总数和经济状况等一系列异构数据源来深度分析突发现象背后的本质和科学规律。

大数据与智慧城市有着密不可分的联系。作为城市发展的高级阶段,智慧城市创造了以互联互通、整合共享、协同联动、创新发展为主要特征的城市发展新模式,大数据成为全球信息化的重点所在。智慧城市建设带来了数据量的爆发式增长,城市中密布的各类传感器、移动电话、GPS设备,甚至城市中的人都可成为信息的源头。目前,智慧城市建设所产生的数据量已超过了200PB,而大数据就像血液一样遍布智慧交通、智慧医疗、智慧生活等智慧城市建设的各个方面,城市管理正在从“经验治理”转向“科学治理”。智慧城市是否真正“智慧”源自城市大数据,如何挖掘海量数据的潜在价值并为城市系统的运行管理决策提供支撑,是智慧城市建设的关键。

城市基础运行的智能化程度是体现一个城市是否“智慧”的重要指标。本书内容中将多次提及城市基础运行领域,并以此为例进行解构分析。城市基础运行主要指城市基础设施(如道路、桥梁、矿体、水库、地下管网等)及其相关城市部件(如车辆)的运行。城市基础运行管理的主体是政府部门,服务对象面向城市系统中的政府、企业(社会团体)和个人。智慧城市基础运行管理需要对城市部件的基础状态和运行状态进行实时感知和控制,整合城市基础运行相关的政务信息资源和社会信息资源(包括社会公开信息资源及政府有权限提取的非公开信息资源),实现跨领域、跨部门、跨层级、跨主体的信息共享和业务协同,并借助数据挖掘、系统仿真、智能检索等技术手段,为城市基础运行管理和决策提供有效支撑。

1.2.3 新一代信息技术助力三元世界融合

1.物联网与移动终端催生城市大数据需求

大数据时代最大的特征不在于数据本身,而是在数据的源头。数据的主要来源不再是普通的PC和服务器,而是被物理世界不断创造出来,并被物理世界和生活在物理世界中的人所接收、处理和利用。物联网产生的是物理世界的感知数据,移动终端产生的是人类社会的应用类数据和行为类数据。随着物联网与移动终端的普及和发展,人类社会与物理世界日益紧密相连,大数据在这个过程中应运而生。

2.云端的选择为大数据决策指引新的航向

云计算和云存储的应用使能够“理解数据、做出决策”的大数据技术成为现实。通过把数据存储和数据分析变成可以更加方便获得的网络服务,全球政府、企业和个人使用、消费信息技术的模式正在改写。借助“云”的伸缩性,构建云端之上的大数据平台,实现大数据资源的“按需配置”,并最终获得更大空间的决策弹性。但是,云端的大数据应用目前仍然存在障碍,如美国能源部提出的数据分析问题,一个基于云端的解决方案无法满足对EB量级的数据处理需求。

3.三元世界下的新一代信息技术趋向融合

在复杂性科学视野下,科技创新必须实现技术发展与应用创新的并驾齐驱。中国科学院战略性科技先导专项“面向感知中国的新一代信息技术研究”中指出,信息化水平是当代社会生产力的重要标志,信息化的终极目标是利用信息技术将人类社会与信息空间、物理世界相互融合,形成“人机物”三元一体的世界。大数据与物联网、云计算、移动互联网等新一代信息技术共同构成“人机物”三元世界融合的助推器(参见图1.4)。

图1.4 “人机物”三元体系下的新一代信息技术

移动终端颠覆了传统的社会行为和关系网络,物联网融合了人类社会与物理社会的边界,云彻底改变了信息服务的方式,而大数据则重构了相关产业和领域的格局。“人机物”三元融合体系的形成是城市化发展的大势所趋,新一代信息技术的融合则是这次变革浪潮的核心推动力。