人类时空间行为数据观测体系架构及其关键问题

  • 柯文前 , 1 ,
  • 俞肇元 , 1, 2 ,
  • 陈伟 3 ,
  • 王晗 1 ,
  • 赵珍珍 4
展开
  • 1. 南京师范大学地理科学学院,南京 210023
  • 2. 江苏省地理信息资源开发与利用协同创新中心,南京 210023
  • 3. 东北师范大学地理科学学院,长春 130024
  • 4. 南京大学地理与海洋科学学院,南京 210093
俞肇元(1984- ),男,安徽南陵人,博士,副教授,研究方向为地理信息系统与地理建模。E-mail:

作者简介:柯文前(1988- ),男,福建晋江人,博士生,主要研究方向为空间结构与行为地理学。E-mail:

收稿日期: 2014-08-15

  要求修回日期: 2014-12-23

  网络出版日期: 2015-02-10

基金资助

国家科技支撑计划项目(2012BAH35B02)

国家自然科学基金项目(41071084, 41201377)

江苏省自然科学基金项目(BK2012454)

江苏省优势学科资助项目

Architecture and key issues for human space-time behavior data observation

  • KE Wenqian , 1 ,
  • YU Zhaoyuan , 1, 2 ,
  • CHEN Wei 3 ,
  • WANG Han 1 ,
  • ZHAO Zhenzhen 4
Expand
  • 1. College of Geography Science, Nanjing Normal University, Nanjing 210023, China
  • 2. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China
  • 3. College of Geography Science, Northeast Normal University, Changchun 130024, China
  • 4. College of Geographic and Oceanographic Sciences, Nanjing University, Nanjing 210093, China

Received date: 2014-08-15

  Request revised date: 2014-12-23

  Online published: 2015-02-10

Copyright

《地理研究》编辑部

摘要

大数据的行为研究具有丰富的数据源,但在数据的尺度、信度、精度、粒度和研究边界等方面仍存在诸多问题,且涉及隐私、可预测性等广泛争议。依据“信息获取方式确定—信息获取手段整合—信息类型划分—信息解析与要素提取—行为属性与要素集成”的思路,构建了整合高精度、全要素和多视角的行为数据观测体系架构。梳理与论述了行为研究中行为变化的尺度依赖特征,个体行为与群体行为数据的区分与综合,行为数据需求与个体隐私边界界定及行为数据的解析、匹配与整合等关键问题。尝试从科学问题的边界界定与数据需求、多源数据采集与整合方法、多要素行为数据解析与集成方法及应用驱动的行为数据应用模式与途径等方面,对行为数据的综合采集与集成处理进行界定。

本文引用格式

柯文前 , 俞肇元 , 陈伟 , 王晗 , 赵珍珍 . 人类时空间行为数据观测体系架构及其关键问题[J]. 地理研究, 2015 , 34(2) : 373 -383 . DOI: 10.11821/dlyj201502016

Abstract

Human space-time behavior is the core element of behavioral geography and time geography, as well as one of the key issues that influence the society and economy. The advent of the "Big Data Era" provides abundant data for the study of space-time behavior. However, it also brings many problems in the scale, reliability, precision, granularity and research boundary of the provided data, which initiates controversy about individual privacy, and behavioral predictability. With the basic idea of "information collection mode construction-information collection methods consolidation-information type division-information parsing and elements extract-behavior properties and elements integration", this paper aims to build architecture for space-time behavior data observation, which consolidates high precision, total elements and multi-perspective behavior data. On the basis, four important issues are hackled and discussed, which include: scale dependency of system behavior and random behavior; differentiation and synthesis of individual behavior characteristics and group behavior regularity; strictly demarcation of behavior data demand and individual privacy boundaries; parsing, matching and integrating of behavior data. Based on the targeted issues, we attempt to achieve comprehensive collection and integrated processing for behavior data in several ways. Firstly, define data collection boundary and data demand on the basis of the scientific issues of behavioral research. Secondly, propose an acquisition mode of consolidating multi-source data collection means. Thirdly, provide the methods and ideas of multi-elements behavior data parsing and integration. Lastly, identify the application modes and ways of behavior data based on the perspective of application drive. What have been discussed above can not only lay a solid foundation for highly accurate and quantitative space-time behavior research, but also offer theoretical and methodological references for comprehensive integration research of sensing regional/urban society and spatial system from the view of microcosmic individual behavior.

1 引言

人是社会的主体。地理学对人类时空行为的关注最早出现在行为地理学和时间地理学领域,涉及迁居、购物、出行、通勤等诸多方面[1-5]。早期研究缺乏获取详尽的微观个体数据以及表达复杂地理环境的分析工具,而更注重宏观、汇总层面的静态性分析。近年来,随着智能终端、物联网等技术的发展,个体行为时空数据的采集与分析发展迅速。基于数据驱动的行为分析日渐成为主流。大数据分析技术使得隐藏在数据背后人的行为时空模式与规律得以浮现[6-10]。Barabasi等相继在Nature上发表论文[11,12],利用海量的时空数据揭示人类行为对泊松过程的偏离及其空间标度律特性,大幅推动了数据驱动的时空行为分析。数据驱动的行为分析可以对人类社会的政治、经济决策、公共安全、公共卫生等诸多领域产生根本性的突破与变革,已成为行为地理乃至整个人文地理研究的热点内容之一[13-18]
由于缺乏对相关研究问题所需数据的严格界定以及规范化的观测体系,不同的行为数据在精度、信度、尺度、粒度等差异巨大,并引发了诸如隐私、行为可预测性等广泛争议。现有研究多仅涉及特定场景中人的行为,如对人的分类就存在“活动的人”(购物[19,20]、休闲[21,22]、就业和居住[23,24])、“移动的人”(出行[25,26]、通勤[27,28]、迁居[29])、“城市内部的人”[30,31]、“短期/日常时空行为的人”[32]等多个单独的标签。上述研究的数据多为日常活动日志调查、访谈和GPS数据,使得对其全方位透视有很大困难[33]。一个可行的思路是将“人”这一主体放入真实的、复杂的地理场景中,对人在多个时空尺度上的虚拟行为与实体行为、移动系统与活动系统、个体行为与群体模式等整体性进行全方位的观测。发展与整合高精度、全要素和多视角的行为数据综合观测体系成为必须。
3S技术、物联网、移动互联等技术的快速发展,使得包含地理位置、社会属性、移动轨迹、迁移过程和交互模式等信息的人类时空行为数据综合、连续观测成为了可能。遥感遥测设备、GPS等的广泛应用为位置信息的获取提供了持续的数据源。手机、平板电脑等移动互联设备则成为了记录和分析人与人之间时空位置、交互联系以及行为模式的综合数据平台。遍布全城的视频网络及图像采集设备持续真实地记录了城市级别乃至更大尺度社会运行状态的信息。跨越区域之间的快速交通流则架构了城市之间紧密相连的桥梁。社交网络、网上签到、微博、志愿者地理信息(VGI)提供了人类行为模式与交互的综合性系统平台,持续记录着现实与虚拟世界中人的各类行为。云计算以及城市计算等技术作为一个巨大的数据处理器,则可以用于实现对复杂人类行为特征、过程和机理的分析与识别。对上述行为数据进行有效的梳理、整合、分析与挖掘,有望揭示个人行为模式、群体结构特征、人群交互响应过程与社会网络结构,以及从微观行为洞悉宏观空间形态与空间结构动态演变的内在机理。
鉴于发展全方位行为数据在“人”的研究中的重要性和必要性,拟以科学认知角度构建人类行为数据观测体系架构,并梳理和论述数据采集过程中的几个关键问题。在此基础上,尝试从行为研究科学问题的边界界定与数据需求出发,探讨多源、多视角数据采集与整合方法,多要素行为数据的解析与集成以及应用驱动的行为数据应用模式与途径等方面,实现对行为数据的综合采集与集成处理。所探讨的行为数据观测体系架构及关键问题,可为行为地理学、时间地理学与相关学科的学科定位、基础理论及实践应用研究等提供有益参考。

2 人类时空间行为数据观测体系架构

2.1 数据观测体系在时空行为研究中的作用剖析

在大数据时代,人的行为模式(空间范围,活动习惯,社交网络,交往模式等)都具有可控的采集模式,但如何根据地理学研究的核心问题及其边界对相关数据进行界定、细化和整合仍是亟待厘清的关键问题。综合考虑行为科学的学科需求、数据特征、采集手段和应用需求等,遵循“行为认知体系—基础研究系统—功能支撑系统—规律与应用系统”的基本主线,构建大数据时代人类时空行为研究的总体框架(图1)。
Fig. 1 The overall framework of space-time behavior research

图1 人类时空行为研究的总体框架

从行为研究的框架看,数据观测体系是行为研究范式的重要组成部分,在人类时空行为分析中发挥着承前启后的关键性基础作用。具体而言,“认知体系及研究范式”是时间地理学、行为地理学、社会学、心理学等多学科所共有的理论基础依托,同时也是数据观测体系的学科需求。“基础研究系统”所探讨的行为特征、分布结构、动态过程和要素关系是行为科学的核心论题,是数据观测体系的关键入口。“规律与应用系统”的行为模式识别、规律认知与特征预测等是连接理论与实践的重要部分,扮演数据观测体系的主要出口。作为主导连接入口与出口的“功能支撑系统”,由数据观测体系和分析体系组成,且观测体系也是分析体系能否实现的基本前提。以上各系统间的内在关联为明确行为数据采集的地位和作用,进而为完整的行为数据观测体系架构的建立提供了佐证和依据。由此昭示,从科学认知的视角出发,遵循一定范式的有机整合思路构建行为数据观测体系架构,可有效支撑人类行为研究科学范式的建立。

2.2 人类时空间行为数据观测体系架构的构建

人类时空行为数据采集的主要目的是搭建完整的连续时空尺度序列和综合性属性要素的行为数据观测体系。依据“信息获取方式确定—信息获取手段整合—信息类型划分—信息解析与要素提取—行为属性与要素集成”的基本思路,构建具有层次结构的人类时空行为数据观测体系的整体架构(图2)。具体展开为,以个体主动参与和群体被动感知的非侵入式 (①非侵入式主要指尽量减少被观测者感知的观测方式,如利用街道的视频监控等。一方面尽量避免被观测者由于显式或者隐式的隐私保护心理导致的数据观测误差,另一方面着重保证对被观测者的隐私保护。)采集方式为依托,囊括小区、城市、区际、全球等不同空间尺度和跨越日常、生命、社会、历史的时间维度上,整合问卷、访谈、GPS、网络、手机、视频、智能卡等多种信息获取手段。连续采集蕴含不同信息类型的时空轨迹数据、密集点云数据、视频监控数据、影像序列数据、文本序列数据、多要素时序数据、阵列数据、模式数据和图像图片数据等传感器数据。进而建立信息类型与行为属性间的映射规则,解析与提取时空位置数据、分布格局数据、语义信息数据、属性特征数据、动态过程数据和要素关系数据等要素信息。在此基础上,对行为的特征属性、活动属性和移动属性进行关联、匹配与整合,从而实现时空多尺度序列的综合观测与行为多要素属性的综合集成。
Fig. 2 The architecture for human space-time behavior data observation

图2 人类时空行为数据观测体系架构

观测体系中,不同信息获取手段的交叉观测可采集多时空尺度上有对应关系的行为属性数据。其中,智能手机主要采集个体时空位置、要素关系和属性特征数据,用于解决城市尺度上个体日常的时间、空间、图像、影音和社会关系问题,重点解决个人行为的特性问题;基于GPS、浮动车、公交刷卡和手机基站的大规模高精度的时空位置和分布格局数据,为都市区尺度个体日常活动、移动时空行为提供持续数据源;视频主要获取动态过程、要素关系和语义信息数据,解决小区、城市和都市区尺度上个体交互模式与群体行为时空特征结构,并面向应用解决优化和疏导问题;覆盖城市群、区际和全球尺度的快速交通网络和ICT技术的要素关系数据,主要解决个体虚拟行为与实体行为的关系网络、舆情导向、社会文化和信息传播等问题;基于大规模调查问卷的长期行为数据和深度访谈的个体生命历程的属性特征数据,则可用于城市和都市区尺度的个体行为过程演变和形成机制探讨。

3 人类时空行为观测的关键问题

对“人”的全面观测,需要同时解决行为数据采集过程中的几个关键问题。其中,人的行为同时具有随机行为和系统行为两类,且其变化具有尺度依赖特征和明显的社会性,需要连续时空尺度的观测序列;微观个体和宏观人群的双重属性决定了需要对个体行为的事件性与群体行为的规律性进行区分与综合,因而要求在真实地理场景中对整体人进行实时、连续和动态观测;广泛的数据收集可能涉及隐私,使得对“人”的观测在操作上具有高度复杂性,需要有顾及科学研究的问题需求和个体认知的隐私边界的非侵入式数据采集手段;行为特征与数据特征有内在对应关系,需建立传感器数据集到行为特征表达的数据之间的有效映射,并通过综合多源、多类型的行为数据,进行信息的解析、匹配与整合,进而实现行为数据的概念抽象、整体表达与集成分析。对以上问题的系统处理是全方位解析人类行为复杂性的前提,同时也是深入、科学、准确理解诸多人文地理现象的关键所在。

3.1 随机行为与系统行为的时空多尺度的连续观测

3.1.1 行为可认知和预测性问题与行为的时空多尺度表征 时间地理学和行为地理学都建立在人类行为存在普适规律,且其复杂性可被认知和预测的前提之上。然而人的行为有随机行为与系统行为两类,行为的可认知与预测性问题与两类行为在时空多尺度上的表征密切相关。当行为模式与其时空尺度相匹配时,系统行为多具有高可预测性;否则多表现为随机行为,导致其规律性和可预测性减弱[34]。行为数据统计特征上的平稳性或非平稳性也是尺度依存的。通常在高精细的尺度下,行为表现为噪声多、随机成分混杂的非平稳过程,而在较大尺度上的转变将抵消小尺度上异质性的高频波动,可能涌现出结构性成分的平稳过程[35]。由于上述特性的存在,对行为的观测需要引入时空多尺度的概念,通过行为特征在不同尺度上的数据特征及内在信息,确定各类行为最佳的观测与分析尺度。一般而言,单一时间点和空间位置上行为的随机性和不确定性相对较强,但长时期和大范围行为变化的统计规律性则多数是可预测的。
3.1.2 时空多尺度观测不均衡问题较突出 行为研究中空间维度关注高于时间的时空多尺度观测的不均衡问题较为突出。主要表现在现有研究已突破以单一城市为单位的研究,开始关注都市区、城市群和区际尺度[36,37],但大部分所用仍是短时性的数据,而以年为单位进行多年演化特征的研究几乎是空白。空间范围从城市内部和都市区的通勤圈或“一日生活圈”,扩展到由人口迁移、休闲旅游和部分城际购物而形成的拓展生活圈和交流圈等[38],近来已有通过京津跨城流动的实证对此做出了初步的探索[39],但仍未能实现较长时段上的连续观测。通常,对时间维度的关注普遍围绕短期、日常的行为展开(以月、周、天、小时等为单位),而对中长期行为的分析明显不够,导致的直接结果是无法很好地理解个体社会角色日常生活方式形成的长期变化与表现机制,社会制度与关系网络等非空间制约对行为的影响机制,以及历史时间与生命时间的互动关系等[32]
3.1.3 连续时空尺度数据观测序列的建立 为有效识别合适的时空尺度及在相应尺度明确区分系统行为和随机行为的差异,需要进行时空多尺度的连续观测。即在GPS、手机等短时、高频的时空位置数据基础上,同时要有能够支撑长尺度的、相对稳定事件的要素关系、分布格局、动态过程、语义信息和属性特征等数据。由此提出,在空间上的观测应从城市内部空间向都市区、城市群、区际、全国乃至全球的扩展,时间上也应融合短期日常时空行为、长期的迁居行为和生命历程及历史时间等。因此,需整合现有GPS、活动日志调查与手机、智能卡刷卡、浮动车、视频、网络签到、微博等一系列不同的观测方法为统一观测体系,针对多个时空尺度上的系统行为或随机行为进行数据观测,为多尺度时空行为与多尺度空间重构的研究提供数据整合思路。

3.2 个体行为与群体数据的区分与综合

3.2.1 人具有微观个体与宏观人群的双重属性 人具有微观个体和宏观人群的双重含义,在行为上既存在区别又有一定交叉关系。其中,个体行为可看作一系列有意义的事件序列,具有很强的事件性,因而更关注每个事件及个体自身特殊的属性因素;而群体行为则更多地表现为大量个体行为序列的整体性和规律性的统计特征。两者的交叉关系表现为,群体对个体有制约作用,个体则为群体提供机制和功能[40]。具体为,非汇总的单一个体异质性凸显,使得行为变得不可预测,而在大量个体汇总的群体统计行为较规则,即个体层面的杂乱无章在社会驱动作用下,群体层面会自组织地表现出物理学的运动规律[41,42]。个体和群体表现出的复杂内在关系,使得个体间的交互机制及基于个体模拟较大规模的人群移动过程与特征解析较为困难。另外,现实地理场景中,人与人的交互把整个社会连接成为活性的整体,如何有效阐述社会交互对个体与群体行为的统计特性的影响也是当前一大挑战[43]
3.2.2 特定场景的研究致使真实的行为模式和内在机理缺失 目前,对于行为观测缺少与事件和真实地理场景挂钩的动态过程数据和语义信息数据,致使真实的行为模式和内在驱动机理缺失。大多情况为,个体行为的研究以GPS、LBS类数据为核心展开,集中于个体日常活动与社会经济要素关系的探讨。及移动的轨迹跟踪与重建、轨迹分类、轨迹模式的挖掘等[43-45]。受限于动态过程复杂的群体行为,集中在其影响模式的空间特性和状态上,主要基于个体层面的实测数据,辅以统计模型进行群体行为模式分析;或基于智能体、细胞自动机等统计模拟方法探讨给定规则和场景下,群体行为的响应特征[46]
3.2.3 真实地理场景中行为的实时、动态观测 通过对个体行为动态交互在特定群体的响应特征进行实时观测,并对人的行为模式内在机理的挖掘与模拟,有助于实现个体行为与群体行为数据的区分与综合。为支撑上述机理挖掘与模拟,对行为的观测需同时有能够覆盖大范围、全时段和动态性的特征。遍布全城的视频设备以网络化覆盖、全天候特性,可探测特定位置和过程的群体动态特征和事件类型,且高精度的属性可精细化地识别群体内部个体的活动特征及相互作用过程。因此,视频技术为实现复杂场景中与事件和空间的直接挂钩,理解复杂行为模式与环境的互动关系,并面向实际提升应对突发事件或群体性事件的决策能力等提供了新的和主要的数据来源。

3.3 广泛的数据收集与个人隐私保护

3.3.1 显式与侵入式行为数据收集的问题 广泛的行为数据收集可能涉及个体隐私导致数据信度和精度问题。现有的数据采集方式(如GPS、访谈等)多为显式和侵入式的,非侵入式获取手段的缺失,是导致真实数据获取困难和分析低效的关键原因之一。观测对象出于隐私保护的心理,往往会避免敏感的行为信息被采集和捕获,从而导致数据信度的降低。而行为数据的高敏感性也导致了数据公开获取与广泛使用上的诸多限制。具体而言,主要体现在如下方面:① 样本代表性和典型性问题。基于传统调查、访谈或结合网络的活动日志调查,一般仅能选取自愿的个体进行,数据精度、样本全面性和无偏性等容易存在缺陷[47]。② 完整性问题。数据需求没有完整预估导致低效化问题,如在数据获取和挖掘过于谨慎,得到的信息量不足以支撑研究需求[48]。③ 数据过度采集与使用问题。对数据粒度边界认识模糊,普遍希望获得和挖掘个体高精度、多属性等的详尽信息,而使得个人兴趣爱好、行为模式、社会习惯等隐私的泄露,可能给个体生命、财产安全带来困扰[49]
3.3.2 严格数据采集边界界定是隐私是否受侵犯的准则 行为隐私性是否受到侵犯,本质上是科学研究的问题需求与个体认知的隐私边界的界定问题。对个体而言,不同对象对隐私的看法和观念不同;而从地理学角度探讨人类行为,针对的是“典型人”的特征,这决定了行为研究关注的人既是具体人同时也是抽象人,需要的是有一定共性的、抽象的数据。同时,从心理学的视角出发,个体对显式的、侵入式的数据采集普遍具有排斥感与高隐私敏感性,但对于非侵入的、间接的数据采集方式则反应相对平和。因此,为在个性与共性之间找到平衡点,并尽可能降低个体对显式的、侵入式的采集方式的排斥感和敏感心理,就必须有严格与明确的数据采集边界和使用权限规则界定的非侵入式采集方式。
3.3.3 兼顾个体和群体构筑非侵入的数据采集方式 以个体主动参与和群体被动感知两层面提出明确的观测权限边界,以此构筑隐私非侵入式的采集方式。主动参与式就是个体在明确知悉行为研究的目的和所需数据的边界、粒度等基础上,提供关于位置、移动性、活动方式、社会关系等真实的行为信息。在此类情况中,即使获取的数据包含隐私信息并可识别到具体个人,但地理学研究的“典型行为”可避免隐私的泄露,达到对个体生活的非破坏性。被动感知式即群体在日常生活中,并不了解可能涉及自身隐私的数据正被采集或可能的使用途径,例如电信运营商通过手机基站获取海量个体的通话记录、部分权威部门采集实名制的移动信息或个体属性等。对于此类情况,更多的是需要采集方对数据安全的保护,或将数据提供给第三方前利用一系列技术和方法的模糊化、匿名化或虚假化等处理,达到对个体隐私的保护[50]。当然,在大数据时代涉及隐私的数据被采集和存储不可避免和已成趋势的情况下,综合运用技术、法律和道德来共同制约数据采集者、供应者和使用者,可最大限度避免隐私的泄露[49]

3.4 多源行为数据的解析、匹配与整合

3.4.1 数据特征的综合与集成是行为特征解析的前提 对多源的行为数据进行解析、匹配与整合是实现行为解析的前提。这是因为,行为特征是多种行为属性综合反映的一个行为综合体,而数据特征则是行为特征的信息承载体,即行为特征决定数据特征,数据特征反映行为特征[51]。从数据类型上,现有各种不同类型的行为观测技术获得的数据包括有时空轨迹、密集点云、图像图片、文本序列、多要素时间序列、视频监控、影像序列和阵列数据。从行为特征分析的数据需求上,则需要有时空位置数据、分布格局数据、语义信息数据、属性特征数据、动态过程数据和要素关系数据等信息支撑。如何建立传感器数据集到行为要素信息之间的有效映射,并进行多种属性和要素间的关联、匹配与整合,是当前行为数据观测所必须解决的重要问题。
3.4.2 不同行为属性分别研究的困境 对行为的活动属性、移动属性和特征属性等的融合关注较少,致使行为数据的解析、匹配与整合困难。主要体现在,利用活动日志调查或GPS轨迹数据,存在把活动行为与移动行为相割裂,忽视了各种活动行为之间的有机联系,缺乏将活动属性与移动属性相结合的系统视角[52]。即使有通过GPS和活动日志调查在网络系统平台支持下进行关联采集的尝试[47],但仅是活动与移动中部分行为数据特征的整合,仍未能解决多源数据的直接匹配。实体空间和虚拟空间共同作用下对活动行为、移动行为的影响,使得特征属性应该同时涵盖虚拟和实体社会网络,而这方面国内在研究框架的合理性、研究数据的完整性、研究方法的系统性等极度缺乏[53]。至于从整体行为数据特征视角出发的关联匹配与整合来挖掘人的行为特性则基本属于空白。
3.4.3 多源行为数据的解析、匹配与整合的算法建立 实现行为观测的传感器数据与行为要素信息的映射,并对行为数据进行解析、匹配与整合,需要有一系列算法和规则共同支撑。首先,数据间映射的实现核心在于,对传感器数据蕴含的信息进行解译基础上,以多维混合信息的提取、拆分为目标,通过一对一或多对一的对应关系建立映射规则。其次,行为数据的解析在实现上需要有适用于数据特点快速重组、解析与运算的数学结构与运算结构,构建相应的数据解析方法;对上述的一系列参数进行解析,可实现基于数学结构表达的行为对象和地理场景的快速解析、提取、重组与运算。为实现不同属性和要素的关联、匹配与整合,可基于时空索引技术对不同的要素进行统一组织与编码,将不同的要素整合与关联为相应的特征属性、活动属性和移动属性,为之后的高效数据挖掘和行为解析做准备[54]

4 结论与讨论

21世纪是人文社会科学迅速发展并走向实用的世纪[55,56]。新型数据采集手段和分析工具的不断涌现、多学科对行为数据的广泛应用使得行为科学研究成为当前人文地理学研究的关键性领域之一。当前行为地理相关的各类理论不断发展,行为数据已在区域经济、城市发展、社会生活、商业文化等领域得到了广泛应用,并已积累大量实践经验。从宏观理论体系出发,充分发挥地理学者的顶层设计和宏观架构能力,对人类时空间行为研究的科学问题及所需的关键性数据进行标准化的界定,进而整合多种观测手段构建标准化的数据采集与观测体系无疑对其学科发展及领域应用均具有重要的促进意义。本文在对现有主要的研究工作系统梳理基础上,构建了面向大数据时代的人类行为时空数据集成观测体系,并对其所可能涉及的关键问题进行论述,旨在为时空行为的精细化、定量化的综合数据采集与分析提供基础,并希望可以为从微观个体行为的视角感知城市和区域社会及空间体系的定量化综合集成研究提供理论与方法借鉴。
从理论走向实践,以实践回溯理论的双向互动循环机制是学科定位、发展和前进的根本动力。本着这一理念,明确了本文研究在大数据驱动范式的行为科学诸多应用领域中可产生助益的几个方面:① 以全方位数据的融合分析,深化对个体和特定群体的行为特征挖掘,提炼各类行为模式,实现人的社会行为感知与预测,为个性化服务需求提供有效支撑;② 拓展整体人的行为与城市、区域空间互动机理的解析,模拟基于行为的城市、区域空间结构动态演变,促进以人为本空间规划理念的普及;③ 开拓个体、群体及与事件相挂钩的交互响应机制研究,提升对于突发性事件的防控能力、应对能力和决策能力。
需要指出的是,本研究主要集中在对行为数据采集与整合的总体框架论述上,对诸多具体实现的细节难以进行系统性展开。未来主要工作集中在:① 发挥互联网、社交、微博等公众参与互动平台的优势,优化传统问卷调查与访谈等采集手段,并研究与其他移动定位技术的整合方法。② 面向理论分析与公共安全事件的监控、识别、管理及应急疏散等应用需求,发展可支撑复杂地理场景的基于视频技术的个体交互与群体行为的快速算法及模型与方法集。③ 针对多源异构数据和差异化隐私特征,开发应对不同数据类型和服务需求的隐私保护技术。④ 面向多源行为数据解析、匹配与整合需求,研发适用于行为数据快速重组、解析与运算的数据结构与运算结构及解析方法,并研究不同数据序列关联匹配的时空索引技术。

The authors have declared that no competing interests exist.

[1]
Hägerstrand T.What about People in Regional Science? Papers and Proceedings of the Regional Science Association, 1970, 24(1): 7-21.

[2]
柴彦威, 刘志林, 李峥嵘, 等. 中国城市的时空间结构. 北京: 北京大学出版社, 2002.

[Chai Yanwei, Liu Zhilin, Li Zhengrong, et al.The Time-space Structure of Chinese Cities. Beijing: Peking University Press, 2002.]

[3]
Golledge R G, Stimson R J.Spatial Behavior: A Geographic Perspective. New York: The Guilford Press, 1997.

[4]
柴彦威, 颜亚宁, 冈本耕平. 西方行为地理学的研究历程及最新进展. 人文地理, 2008, 23(6): 1-6.

[Chai Yanwei, Yan Yaning, Okamoto Kohei.Development of behavioral geographic research in western countries and its recent progress. Human Geography, 2008, 23(6): 1-6.]

[5]
柴彦威, 王茂军. 日本消费者行为地理学研究进展. 地理学报, 2004, 59(S): 167-174.

[Chai Yanwei, Wang Maojun.Progress of geographical study on consumer behavior in Japan. Acta Geographica Sinica, 2004, 59(S): 167-174.]

[6]
Demsar U, Virrantaus K.Space-time density of trajectories: Exploring spatio-temporal patterns in movement data. International Journal of Geographical Information Science, 2010, 24(10): 1527-1542.

[7]
Ren F, Kwan M P.Geovisualization of human hybrid activity-travel patterns. Transactions in GIS, 2007, 11(5): 721-744.

[8]
Liu Yu, Kang Chaogui, Gao Song, et al.Understanding intra-urban trip patterns from taxi trajectory data. Journal of Geographical Systems, 2012, 14(4): 463-83.

[9]
Gao Song, Liu Yu, Wang Yaoli, et al.Discovering spatial interaction communities from mobile phone data. Transaction in GIS, 2013, 17(3): 463-481.

[10]
Liu Yu, Sui Zhenwei, Kang Chaogui, et al.Uncovering patterns of inter-urban trip and spatial interaction from social media check-in data. PLoS ONE, 2014, 9(1): e86026.

[11]
Barabasi A L.The origin of bursts and heavy tails in human dynamics. Nature, 2005, (435): 207-211.

[12]
Brockmann D, Hufnagel L, Geisel T.The scaling laws of human travel. Nature, 2006, (439): 462-465.

[13]
Marta C Gonza´lez, Hidalgo C A, Barabasi A L.Understanding individual human mobility patterns. Nature, 2008, (453): 779-782.

[14]
Song Chaoming, Qu Zehui, Nicholas Blumm, et al.Limits of predictability in human mobility. Science, 2010, (327): 1018-1021.

[15]
R Dean Malmgren, Daniel B Stouffer, Andriana S L O Campanharo. On universality in human correspondence activity. Science, 2009, (325): 1696-1699.

[16]
Bruno G, Duygu B, Alessandro Vespignani.Human mobility and the worldwide impact of intentional localized highly pathogenic virus release. Nature, 2013, 810: 1-7.

[17]
吴健生, 黄力, 刘瑜, 等. 基于手机基站数据的城市交通流量模拟. 地理学报, 2012, 67(12): 1657-1665.

[Wu Jiansheng, Huang Li, Liu Yu, et al.Traffic flow simulation based on call detail records. Acta Geographica Sinica, 2012, 67(12): 1657-1665.]

[18]
龙瀛, 张宇, 崔承印. 利用公交刷卡数据分析北京职住关系和通勤出行. 地理学报, 2012, 67(10): 1339-1352.

[Long Ying, Zhang Yu, Cui Chengyin.Identifying commuting pattern of Beijing using bus smart card data. Acta Geographica Sinica, 2012, 67(10): 1339-1352.]

[19]
焦华富, 韩会然. 中等城市居民购物行为时空决策过程及影响因素: 以安徽省芜湖市为例. 地理学报, 2013, 68(6): 750-761.

[Jiao Huafu, Han Huiran.Research on temporal and spatial decision-making process and influencing factors of residents' shopping behavior in medium-sized cities: A case study of Wuhu city in Anhui province. Acta Geographica Sinica, 2013, 68(6): 750-761.]

[20]
张文佳, 柴彦威. 基于家庭的购物行为时、空间决策模型及其应用. 地理研究, 2010, 29(2): 338-350.

[Zhang Wenjia, Chai Yanwei.A household-based model of shopping decision-making behavior in timing and destination choice: Formulation and application to spatial policy evaluation. Geographical Research, 2010, 29(2): 338-350.]

[21]
汪德根, 陈田, 刘昌雪, 等. 发达地区居民对节假日调整影响休闲旅游的感知分析: 以上海、杭州和苏州为例. 地理研究, 2009, 28(5): 1414-1425.

[Wang Degen, Chen Tian, Liu Changxue, et al.Analysis on the residents' perception of the impacts of holiday revision on leisure travel in the developed regions: Cases of Shanghai, Hangzhou and Suzhou. Geographical Research, 2009, 28(5): 1414-1425.]

[22]
许晓霞, 柴彦威. 北京居民日常休闲行为的性别差异. 人文地理, 2012, 27(1): 22-28.

[Xu Xiaoxia, Chai Yanwei.Gender difference in daily leisure behavior of Beijing residents. Human Geography, 2012, 27(1): 22-28.]

[23]
湛东升, 孟斌. 基于社会属性的北京市居民居住与就业空间集聚特征. 地理学报, 2013, 68(12): 1607-1618.

[Zhan Dongsheng, Meng Bin.Spatial clustering analysis of residential and employment distribution in Beijing based on their social characteristics. Acta Geographica Sinica, 2013, 68(12): 1607-1618.]

[24]
柴彦威, 张艳, 刘志林. 职住分离的空间差异性及其影响因素研究. 地理学报, 2011, 66(2): 157-166.

[Chai Yanwei, Zhang Yan, Liu Zhilin.Spatial differences of home-work separation and the impacts of housing policy and urban sprawl: Evidence from household survey data in Beijing. Acta Geographica Sinica, 2011, 66(2): 157-166.]

[25]
张文佳, 柴彦威. 基于家庭的城市居民出行需求理论与验证模型. 地理学报, 2008, 63(12): 1246-1256.

[Zhang Wenjia, Chai Yanwei.Theories and confirmed model of urban resident's travel demand: Considering intra-household interaction. Acta Geographica Sinica, 2008, 63(12): 1246-1256.]

[26]
曹小曙, 林强. 基于结构方程模型的广州城市社区居民出行行为. 地理学报, 2011, 66(2): 167-177.

[Cao Xiaoshu, Lin Qiang.A SEM-based study on urban community resident's travel behavior in Guangzhou. Acta Geographica Sinica, 2011, 66(2): 167-177.]

[27]
Shen Yue, Kwan Mei-Po, Chai Yanwei.Investigating commuting flexibility with GPS data and 3D geovisualization: A case study of Beijing, China. Journal of Transport Geography, 2013, 32(4): 1-11.

[28]
周素红, 闫小培. 基于居民通勤行为分析的城市空间解读: 以广州市典型街区为案例. 地理学报, 2006, 61(2): 179-189.

[Zhou Suhong, Yan Xiaopei.The impact of commuters' travel pattern on urban structure: A case study in some typical communities in Guangzhou. Acta Geographica Sinica, 2006, 61(2): 179-189.]

[29]
冯健, 周一星. 郊区化进程中北京城市内部迁居及相关空间行为: 基于千份问卷调查的分析. 地理研究, 2004, 23(2): 227-242.

[Feng Jian, Zhou Yixing.Intra-urban migration and correlative spatial behavior in Beijing in the process of suburbanization: Based on1000 questionnaires. Geographical Research, 2004, 23(2): 227-242.]

[30]
周素红, 邓丽芳. 基于T-GIS 的广州市居民日常活动时空关系. 地理学报, 2010, 65(12): 1454-1463.

[Zhou Suhong, Deng Lifang.Spatio-temporal pattern of residents' daily activities based on T-GIS: A case study in Guangzhou, China. Acta Geographica Sinica, 2010, 65(12): 1454-1463.]

[31]
刘云刚, 谭宇文, 周雯婷. 广州日本移民的生活活动与生活空间. 地理学报, 2010, 65(10): 1173-1186.

[Liu Yungang, Tan Yuwen, Zhou Wenting.Japanese expatriates in Guangzhou city: The activity and living space. Acta Geographica Sinica, 2010, 65(10): 1173-1186.]

[32]
柴彦威, 塔娜, 张艳. 融入生命历程理论、面向长期空间行为的时间地理学再思考. 人文地理, 2013, 28(2): 1-6.

[Chai Yanwei, Ta Na, Zhang Yan.Rethinking time-geography in long-term space-time behavior study: Integrating with life course theory. Human Geography, 2013, 28(2): 1-6.]

[33]
Chai Yanwei.Space-time behavior research in China: Recent development and future prospect. Annals of the Association of American Geographers, 2013, 103(5): 1093-1099.

[34]
李双成, 蔡运龙. 地理尺度转换若干问题的初步探讨. 地理研究, 2005, 24(1): 11-18.

[Li Shuangcheng, Cai Yunlong.Some scaling issues of geography. Geographical Research, 2005, 24(1): 11-18.]

[35]
邬建国. 景观生态学:格局、过程、尺度与等级: 2版. 北京: 高等教育出版社, 2007.

[Wu Jianguo.Landscape Ecology: Pattern, Process, Scale and Grade: 2nd ed. Beijing: Higher Education Press, 2007.]

[36]
Kivisto P.Time-space compression. In: George Ritzer. Wiley-Blackwell Encyclopedia of Globalization. New York: John Wiley & Sons, 2012: 17-19.

[37]
顾朝林. 城市群研究进展与展望. 地理研究, 2011, 30(5): 771-784.

[Gu Chaolin.Study on urban agglomeration: Progress and prospects. Geographical Research, 2011, 30(5): 771-784.]

[38]
柴彦威, 刘天宝, 塔娜. 基于个体行为的多尺度城市空间重构及规划应用研究框架. 地域研究与开发, 2013, 32(4): 1-7, 14.

[Chai Yanwei, Liu Tianbao, Ta Na.Individual behavior-based multi-scale spatial reconstruction and its planning application. Areal Research and Development, 2013, 32(4): 1-7, 14.]

[39]
吴康, 方创琳, 赵渺希, 等. 京津城际高速铁路影响下的跨城流动空间特征. 地理学报, 2013, 68(2): 159-174.

[Wu Kang, Fang Chuanglin, Zhao Miaoxi, et al.The intercity space of flow influenced by high-speed rail: A case study for the rail transit passenger behavior between Beijing and Tianjin. Acta Geographica Sinica, 2013, 68(2): 159-174.]

[40]
刘瑜, 肖昱, 高松, 等. 基于位置感知设备的人类移动研究综述. 地域研究与开发, 2011, 27(4): 8-13, 31.

[Liu Yu, Xiao Yu, Gao Song, et al.A review of human mobility research based on location aware devices. Areal Research and Development, 2011, 27(4): 8-13, 31.]

[41]
周涛, 韩筱璞, 闫小勇, 等. 人类行为时空特性的统计力学. 电子科技大学学报, 2013, 42(4): 481-540.

[Zhou Tao, Han Youpu, Yan Xiaoyong, et al.Statistical mechanics on temporal and spatial activities of human. Journal of University of Electronic Science and Technology of China, 2013, 42(4): 481-540.]

[42]
Yan Xiaoyong, Han Xiaopu, Wang Binghong, et al.Diversity of individual mobility patterns and emergence of aggregated scaling laws. Nature: Scientic Report, 2013, (2678): 2678-2682.

[43]
Zheng Yu, Zhou Xiaofang.Computing with Spatial Trajectories. Berlin: Springer Press, 2011.

[44]
David T, John G.On Mining Movement Pattern from Mobile Users. International Journal of Distributed Sensor Networks, 2007, 3(1): 69-86.

[45]
马静, 刘志林, 柴彦威. 城市形态与交通碳排放: 基于微观个体行为的视角. 国际城市规划, 2013, 28(2): 19-24.

[Ma Jing, Liu Zhilin, Chai Yanwei.Urban form and carbon emissions from urban transport: Based on the analysis of individual behavior. Urban Planning International, 2013, 28(2): 19-24.]

[46]
李少英, 黎夏, 刘小平, 等. 基于多智能体的就业与居住空间演化多情景模拟: 快速工业化区域研究. 地理学报, 2013, 68(10): 1389-1400.

[Li Shaoying, Li Xia, Liu Xiaoping, et al.Multi-scenario simulations on the interactions of jobs-housing based on agent-based model. Acta Geographica Sinica, 2013, 68(10): 1389-1400.]

[47]
柴彦威, 申悦, 马修军, 等. 北京居民活动与出行行为时空数据采集与管理. 地理研究, 2013, 32(3): 441-451.

[Chai Yanwei, Shen Yue, Ma Xiujun, et al.The collection and management of space-time data of individual behavior based on location-based technologies: A case study of activity-travel survey in Beijing. Geographical Research, 2013, 32(3): 441-451.]

[48]
王璐, 孟小峰. 位置大数据隐私保护研究综述. 软件学报, 2014, 25(4): 693-712.

[Wang Lu, Meng Xiaofeng.Location privacy preservation in big data era: A survey. Journal of Software, 2014, 25(4): 693-712.]

[49]
Giannotti F, Pedreschi D.Mobility, Data Mining and Privacy: Geographic Knowledge Discovery. Berlin: Springer Press, 2007.

[50]
Yang Yue, Tian Lan, Anthony G O Yeh, et al. Zooming into individuals to understand the collective: A review of trajectory-based travel behaviour studies. Travel Behaviour and Society, 2014, 1(2): 69-78.

[51]
刘汝焯. 审计线索的特征发现. 北京: 清华大学出版社, 2009.

[Liu Ruzhuo.The Characteristics of Audit Trail. Beijing: Tsinghua University Press, 2009.]

[52]
柴彦威, 沈洁. 基于居民移动—活动行为的城市空间研究. 人文地理, 2006, 21(5): 108-112, 54.

[Chai Yanwei, Shen Jie.Travel-activity based research frame of urban spatial structure. Human Geography, 2006, 21(5): 108-112, 54.]

[53]
申悦, 柴彦威, 王冬根. ICT对居民时空行为影响研究进展. 地理科学进展, 2011, 30(6): 643-651.

[Shen Yue, Chai Yanwei, Wang Donggen.Reviews on impacts of information and communication technologies on human spatial-temporal behavior. Progress in Geography, 2011, 30(6): 643-651.]

[54]
郑宇. 城市计算与大数据. 中国计算机学会通讯, 2013, 9(8): 8-18.

[Zheng Yu.Urban computing and big data. Communications of China Computer Federation, 2013, 9(8): 8-18.]

[55]
Duncan J Watts.A twenty-first century science. Nature, 2007, (445): 1.

[56]
Conte R, Gilbert N, Bonelli G, et al.Manifesto of computational social science. The European Physical Journal Special Topics, 2012, 214(1): 325-346.

文章导航

/