中国地质大学(武汉)信息工程学院“科研成果快报”
1. 标题
基于出租车轨迹数据和图卷积神经网络的街道尺度城市功能识别方法研究
Urban Function Classification at Road Segment Level Using Taxi Trajectory Data: A Graph Convolutional Neural Network Approach
2. 成果信息
Hu, Sheng, Song Gao, Liang Wu, Yongyang Xu, Ziwei Zhang, Haifu Cui, and Xi Gong. "Urban function classification at road segment level using taxi trajectory data: A graph convolutional neural network approach." Computers, Environment and Urban Systems 87 (2021): 101619.
This study was supported by the National Natural Science Foundation of China [grant number 41871311], the National key R & D program of China [No. 2017YFB0503600] and the Fundamental Research Funds for National Universities, China University of Geosciences (Wuhan).
3. 成果团队成员
胡胜(第一作者),博士生,中国地质大学地理与信息工程学院。研究方向:空间分析建模和应用
高松,Assistant Professor, Geospatial Data Science Lab,University of Wisconsin – Madison. Research Areas: GIScience, GeoAI, Geospatial Data Science, Social Sensing, Spatial Networks, Urban Informatics, Human Mobility.
吴亮(通讯作者),教授,中国地质大学地理与信息工程学院。研究方向:空间分析建模和应用,空间信息服务。
徐永洋,副教授,中国地质大学地理与信息工程学院。研究方向:深度学习,地理信息系统。
张紫微,本科生,中国地质大学地理与信息工程学院。研究方向:移动大数据,空间分析与建模
崔海福,博士生,中国地质大学地理与信息工程学院。研究方向:时空数据挖掘与知识发现
龚希,博士生,中国地质大学地理与信息工程学院。研究方向:深度学习,功能区分析与建模
4. 成果介绍
近年来,城市建设区无序扩张所带来的土地资源低效利用已成为国家社会经济发展的重要问题。城市的科学发展不应该再继续追求人口增长和面积扩张,而是城市空间格局的优化。随着信息通信技术的普及和地理大数据的出现,人们希望能够对城市空间结构具有精细化和系统化的认知。在此背景下,结合城市空间结构和居民活动对城市功能区进行识别和认知是一个重要的研究方向。人群活动轨迹中包含大量潜在地移动对象的时空特征和移动行为信息。出租车不受线路和时间的约束,是最灵活、覆盖范围最广的轨迹数据,且精度较高、较少涉及隐私问题,常被作为轨迹数据研究和应用的主要数据集。然而,以往研究通常仅考虑从出租车轨迹数据中提取的上下车点等统计信息,对出租车轨迹数据中隐含的语义特征如轨迹序列上下文特征缺乏深入的研究,因此难以准确识别城市功能类型。
研究方法:在本研究中,为了探索交通交互模式与城市功能之间的关系,我们构建了一种新型的地理语义分析框架(见图1)。该框架基于精细化的街道尺度,即设计了一种城市街道功能的识别方法。该框架主要由三部分组成,即街道-轨迹语料库构建及训练、基于街道关联性的图卷积神经网络模型以及结果评价分析模块。具体地,对研究区域内的出租车GPS轨迹数据和城市道路网络数据进行预处理及路网匹配,生成出租车载客轨迹数据和城市主干道数据。将城市街道数据类比为单词,出租车载客轨迹数据类比为文档,街道-轨迹语料库由若干个出租车载客轨迹数据组成,每一个出租车载客轨迹数据为所述城市街道数据中的若干个连续、拓扑相连的街道集合。借鉴Word2Vec模型的训练思想,从街道-轨迹语料库中,选取其中一条街道作为中心街道,将其他街道作为背景街道,通过中心街道预测背景街道,输入街道-轨迹语料库进行无监督的训练,从而间接得到每条街道的特征向量表示。该特征向量包含丰富的城市空间上下文信息和交通交互信息,能有效表征城市的街道功能。另外,考虑到街道之间的上下交通流关联关系,我们以街道为图节点、相互连接的街道为边,构建了一种图卷积神经网络模型。通过输入第一步构建的街道特征向量,以街道的功能作为预测值进行训练。最后,以北京城区为例,我们采用交叉熵损失和预测精度作为评价指标,对比几种传统的方法论证我们提出方法的有效性。
研究路线图
本文图结构的构建
GCNN架构图
研究成果分析与讨论:我们通过对比多层感知机神经网络(MLP)以及输入特征的差异进行评价。为了保证训练结果的鲁棒性,我们进行多次实验并对结果进行分析。实验结果如表1/2所示。我们发现,在总体精度上,我们的提出的方法(即ID为a和c)具有相对较小的损失值和较大的精度,预测精度最高可达0.802,高于基于MLP的方法以及仅考虑上下车点(OD)的方法。
表1. 训练结果对比
ID |
Method |
Loss |
Accuracy |
Mean |
Max. |
Min. |
Std. |
Mean |
Max. |
Min. |
Std. |
a) |
|
0.842 |
1.070 |
0.612 |
0.115 |
0.761 |
0.802 |
0.702 |
0.027 |
b) |
|
1.116 |
1.609 |
0.953 |
0.197 |
0.528 |
0.571 |
0.452 |
0.036 |
c) |
|
0.786 |
0.988 |
0.664 |
0.084 |
0.759 |
0.802 |
0.710 |
0.026 |
d) |
|
1.092 |
1.878 |
0.964 |
0.202 |
0.546 |
0.601 |
0.485 |
0.033 |
e) |
|
0.981 |
1.012 |
0.946 |
0.021 |
0.532 |
0.581 |
0.495 |
0.022 |
f) |
|
1.032 |
1.069 |
0.993 |
0.017 |
0.491 |
0.436 |
0.538 |
0.029 |
表2. 与传统机器学习方法对比
Method |
Mean |
Max. |
Min. |
Std. |
LR |
0.561 |
0.573 |
0.551 |
0.007 |
KNN |
0.543 |
0.821 |
0.435 |
0.116 |
SVM |
0.682 |
0.834 |
0.338 |
0.164 |
RF |
0.671 |
0.834 |
0.327 |
0.164 |
GCNN (Our Proposed) |
0.759 |
0.802 |
0.710 |
0.026 |
Note: LR-Linear Regression Classification, KNN-K Nearest Neighbor Classification, SVM-Support Vector Machine Classification, RF-Random Forest Classification.
结论: 在本研究中,我们提出一种基于轨迹词向量和图卷积神经网络方法的城市街道功能识别的研究。该研究对城市出行轨迹进行深入探索,充分挖掘了居民出行活动特征及道路上下文出行流的特征。实验结果表明,本研究提出的方法对比其他几种方法具有较好的预测性能。本研究致力于为城市规划从业者和相关研究者提供决策支持和研究思路上的参考。
主要参考文献
[1] Kang Liu, Song Gao, Peiyuan Qiu, et al. Road2Vec: Measuring Traffic Interactions in Urban Road System from Massive Travel Routes. ISPRS International Journal of Geo-Information. 2017, 6(11):321
[2] Song Gao, Krzysztof Janowicz, Helen Couclelis. Extracting urban functional regions from points of interest and human activities on location‐based social networks. Transactions in GIS. 2017, 21(3):446-467.
[3] Di Zhu, Fan Zhang, Shengyin Wang, et al. Understanding Place Characteristics in Geographic Contexts through Graph Convolutional Neural Networks. Annals of the American Association of Geographers. 2020, 110(2):408-420