点击此处 加入tg群

 找回密码
 立即注册
搜索
热搜: 活动 交友
查看: 7|回复: 0

IRN2Vec:一种整合地理空间属性和出行行为的道路网络交叉口表示学习模型

[复制链接]

36

主题

0

回帖

1108

积分

管理员

积分
1108
发表于 2026-3-14 22:01:03 | 显示全部楼层 |阅读模式
IRN2Vec:一种整合地理空间属性和出行行为的道路网络交叉口表示学习模型

作者:James Bentley
来源:Plos.org
引用https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0344448

道路网络的结构化特征对实现智能交通系统的性能至关重要。本文提出了一种名为IRN2Vec的交叉口导向表示学习模型,通过整合地理空间属性、语义同质性和移动行为特征,利用LEIRN框架生成具有判别性的道路交叉口嵌入。该模型采用最短路径采样策略构建训练数据,并采用多任务学习方法联合优化三种类型的关系:地理邻近性、标签一致性和分类相似性。在旧金山、波尔图和东京的真实道路网络数据上的实验表明,在交通信号分类和行人过街分类任务中,IRN2Vec在UID、GCN和GAT模型上分别实现了F1-Score平均提高31.6%/25.1%、16.2%/8.6%和27.8%/20.2%。在旅行时间估计中,它将平均绝对误差(MAE)降低了12.2%–24.6%。这些发现为交通状态感知和道路网络优化提供了有效的特征支持。

版权:© 2026 杨晓波。这是一篇开放获取文章,根据Creative Commons Attribution License的条款发布,允许在保持原始作者和来源的情况下,在任何媒介中不受限制地使用、分发和复制。

引言

在城市计算研究中,交通数据是解决众多城市问题的核心基础,对智能交通时空数据的深入分析至关重要。作为多源异构交通数据中最基本和最重要的组成部分,道路网络的结构表示直接影响到系统功能的性能。在这些中,交叉口的数字表示尤其重要,它为各种智能交通系统(ITS)实现其功能提供了基础支持。为了提高ITS应用的有效性,构建具有高质量特征的交叉口和道路段已成为现代道路基础设施发展中的迫切需求。这些特征可以有效地捕捉道路网络的内在复杂性,包括其拓扑连通性、空间分布模式以及不同交叉口之间存在的同质性特征。

在智能交通系统(ITS)的实际应用中,下游任务如交通预测、路线规划和基础设施管理的性能取决于对基本网络元素(即交叉口)学习表示的质量。理想的表示必须全面编码多个方面:拓扑连通性(交叉口如何连接)、空间地理属性(它们的物理位置和邻近性)以及语义同质性(共享的功能或分类属性,例如,都是信号交叉口)。依赖手动工程特征来实现这些方面是低效的,而且往往是不完整的。

近年来,表示学习领域的发展,特别是在自监督和无监督学习方面,提供了一种强大的替代方案,通过从数据中自动提取有用的隐式特征向量(嵌入)[6-8]。这种范式是现代AutoML框架的核心,旨在通过允许模型直接从数据结构本身中发现判别性模式来减少对手动特征工程的依赖——这种工程往往是片面的、有偏见的,并且不可扩展。我们的工作遵循这一原则:交叉口的“隐式特征向量”不是手工制作的,而是由模型学习以同时满足从原始网络和轨迹数据中派生的多个关系约束。尽管在自然语言处理和社会网络分析等领域的应用取得了高度成功[9-11],但将其直接应用于道路网络面临着独特的挑战,这定义了我们工作的动机和新颖性:1)在整合丰富属性方面的限制:标准网络嵌入方法(如GCN和GAT)主要设计用于捕获拓扑结构。它们缺乏原生机制来整合道路网络固有的多模态辅助信息,如地理坐标、交叉口类型或交通控制标签。这导致表示在结构上是有意识的,但在语义和地理上却是贫困的。2)在采样行为真实性方面的限制:这些方法通常依赖于随机游走策略进行网络探索。然而,在道路网络上的移动并不是随机的;用户遵循有目的的路径,通常是起点和目的地之间的最短或最快路径。随机游走无法捕捉这种基本的出行行为,导致采样的节点上下文可能无法反映现实的交通流或功能关系。这种将不同的数据模态(拓扑、空间、语义)整合到一个统一的学习模型中的混合方法,与混合深度学习方法在管理物联网(IoT)生态系统中的复杂性和大量数据方面所展现的有效性是一致的。

为了克服这些限制,本文提出了一种名为IRN2Vec(道路网络交叉口到向量)的全新表示学习模型,用于生成具有判别性的交叉口嵌入。这项工作的核心创新和贡献是:1)多任务学习框架:我们提出了一种统一的神经网络模型,联合优化交叉口之间三个关键关系:地理邻近性、标签一致性和类型相似性。这个框架直接解决了第一个限制,通过无缝地将拓扑、空间和语义属性整合到一个单一的嵌入中。2)基于行为的采样策略:超越随机游走,我们引入了一种最短路径采样策略来构建训练语料库。通过模拟现实用户行程,这种策略采样与实际旅行模式一致的节点序列,从而捕获更有意义的拓扑和功能上下文。这直接解决了第二个限制。3)LEIRN PipeGAT:我们在实际的两阶段框架(LEIRN)中实现了这些想法,用于在大型真实世界数据上进行训练和评估。4)全面实证验证:通过在三个主要城市的道路网络上进行的大量实验,我们证明IRN2Vec在包括交通信号分类、行人过街分类和旅行时间估计在内的任务中显著优于最先进的baseGATs(UID、GCN、GAT)。消融研究进一步证实了我们提出的采样策略和多任务学习目标的单独和互补价值。

这些表示通常是从一个无处不在的物联网(IoT)生态系统中生成数据的,该生态系统包括传感器(例如,环状探测器、交通摄像头、GPS单元)、通信网络和数据平台,共同实现用于我们模型中的时空交通数据的收集和传输。

通过将地理空间属性、语义同质性和现实旅行行为模式整合到网络拓扑学习中,IRN2Vec模型为广泛的ITS应用提供了优越的基础表示。

构建IRN2Vec表示学习模型

为了构建IRN2Vec模型,本文设计了一个名为LEIRN(为交叉口道路网络学习嵌入)的总体架构,用于训练和学习道路网络交叉口的隐式特征向量。如图1所示。LEIRN框架被设计为通过两个新颖的集成阶段将原始、异构的交通数据转换为信息丰富的交叉口嵌入。PPT幻灯片

PNG更大的图像

TIFF原始图像下载:图1. LEIRN整体结构框架。https://doi.org/10.1371/journal.pone.0344448.g001阶段1:感知行为训练数据生成。这个阶段超越了经典的随机游走范式。它从一个道路网络图和轨迹数据[12]开始。在将轨迹与网络匹配后,我们的核心最短路径采样器随机选择起点-终点(OD)对,并使用Dijkstra算法计算连接的最短路径,模拟现实用户行程。对于在采样的路径中共同出现的每一对交叉口(v_i,v_j),我们生成一个训练实例。关键的是,每个实例都根据现实世界的属性标注了三个关系标志:基于欧几里得距离K的地理邻近性标志、标签一致性标志和类型相似性标志。这个过程产生了一个丰富的标注节点对样本语料库。通过从所有交叉口节点集合中均匀随机采样选择OD对进行最短路径计算,这确保了全面覆盖网络并避免了轨迹数据中观察到的对繁忙路线的偏见。对于每个时代,我们采样固定数量的OD对(例如,每个城市100,000个)以保持一致且可管理的训练语料库大小。阶段2:多任务交叉口表示学习。生成的三元组用于训练IRN2Vec模型。模型学习一个共享的嵌入矩阵R,其中每一行对应于一个交叉口的潜在向量[13]。对于输入对(v_x,v_j),它们的嵌入r_x和r_y从R中检索。然后,在多任务学习设置中,通过三个不同的目标函数(对应于三种关系类型)同时评估这些嵌入。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|全球区块链交流论坛 - 币圈论坛 | 比特币交流 | 加密货币挖矿 |网站地图

GMT+8, 2026-6-4 09:57 , Processed in 0.145098 second(s), 29 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表