1. 标题
· Sparse reconstruction with spatial structures to automatically determine neighbors
· 一种结合空间结构和稀疏重建的自适应邻域确定方法
2. 相关成果
Wenhao Yu, Yifan Zhang, Zhanlong Chen & Tinghua Ai (2021): Sparse reconstruction with spatial structures to automatically determine neighbors, International Journal of Geographical Information Science, DOI: 10.1080/13658816.2021.1885675
3. 成果团队成员
· 禹文豪,博士,中国地质大学(武汉)地理与信息工程学院,副教授,博士生导师,主要从事地图综合、空间数据挖掘及智慧城市应用等研究。(联系邮箱:ywh_whu@126.com;个人网站:http://grzy.cug.edu.cn/yuwenhao/zh_CN/index.htm)
· 张一帆,硕士研究生,中国地质大学(武汉)地理与信息工程学院,研究方向为地图综合与空间数据挖掘。
· 陈占龙,博士,中国地质大学(武汉)地理与信息工程学院,教授,博士生导师,主要从事地理信息系统理论与基础软件研发、时空数据挖掘与地理计算、空间认知与推理等研究。
· 艾廷华,博士,武汉大学资源与环境科学学院,教授,主要从事地图综合、空间大数据分析和空间认知等研究。
4. 成果介绍
邻域识别是GIS、地图学等多个领域的基础性问题;例如,空间分析、空间数据挖掘、空间认知和推理等都需首先确定目标的邻域,以便于对数据特征做深入的解析。不同于一般多媒体信息的邻域处理,空间邻域受空间依赖结构的影响,其规律也更为复杂;地理学第一定律对距离与邻域的关系做了指导性说明,而针对具体场景,如何自动确定邻域还存在不少挑战。
常规步骤首先为不同的对象构造一个特征向量,然后计算向量之间的距离(如马氏距离)来定量描述空间关系;邻域的确定则以一定距离阈值作为评判标准。然而,这类方法需人为指定一个全局阈值来界定邻域,忽略了空间异质性的影响,即不同目标的邻域范围会有所不同。过大的全局阈值会导致大量空间关系被概括,而过小的阈值会过于强调局部的变化。为建立自适应的邻域,传统研究大多采用kNN方法,即每个目标仅与其k阶邻居相关;虽然该方法可灵活确定目标的邻域距离,但其本质上仍然受全局阈值的影响,即需指定一个全局的k阶邻居。
空间数据包含大量的冗余特征和关系,部分目标虽然与多个目标邻近,但具有真正相关关系的目标可能只占少数,而且数量也会有所不同。过滤数据中存在的冗余特征,对下游任务的开展非常有益。例如,利用相对较小且关键的数据维度,来降低数据的复杂性。但传统研究主要关注冗余特征的细化,而对于空间关系的细化,少有研究涉及。为了解决现有技术的不足,本文提供了一种结合空间结构和属性信息的自适应邻域确定方法(图1),利用稀疏重建的思想,在稀疏正则项约束下保证重建前后的空间和非空间特征的相似性,并压缩数据中的冗余关系,找出与目标真正相关的邻居。本文以空间数据挖掘的缺失值填充(图2)以及地图综合的建筑物模式分类(图3)为例,说明该方法对多个领域均有重要的潜在价值。
图1 框架图
图2基于自适应邻域的路网弧段标签预测
(计算每条弧段具有强相关性的邻近弧段集,然后依据邻近弧段的标签推测当前弧段的缺失标签)
图 3 基于邻域分析的建筑物模式分类对比
(图a为基于本方法的聚类结果,图b为基于传统邻域分析的聚类结果,图c为基于自然邻域方法的聚类结果)