Fifty Years of Object Detection and Recognition from Synthetic Aperture Radar Remote Sensing Imagery: The Road Forward

基本信息

为什么我们迫切需要这篇五十年全景综述?

图1 SAR ATR的重要性。2020年至2024年,遥感(RS)和计算机视觉(CV)领域每年发表的论文数量已达到相近水平(差距小于10%)。然而,GitHub上公开的与遥感相关的代码库数量仍然相对有限,仅约占计算机视觉领域的四分之一。这种差异凸显了遥感界在推进开源生态系统发展方面存在巨大的未开发潜力。(b)2020年至2024年遥感相关论文中最常见的关键词。每个单词的大小与出现频率成正比,这表明合成孔径雷达(SAR)、图像分类和目标检测等概念受到了广泛关注。(c)SAR ATR在极地海冰监测、深空探测、森林/洪水/形变监测,以及公共安全等方面得到了广泛应用且不可替代。(所有论文数量统计数据均来自Web of Science核心合集数据库。)

合成孔径雷达(SAR)成像可在几乎所有天气和光照条件下对目标进行观测,已成为目标与场景分析和识别领域中不可或缺的信息获取手段。合成孔径雷达自动目标识别(SAR ATR)是遥感图像分析领域最基础且极具挑战性的研究问题之一。如今,以大模型和智能体为代表的人工智能技术重构了研究范式,对各研究领域产生了深远影响,并正以前所未有的速度持续发展。然而,人工智能技术在 SAR 图像解译中的巨大潜力仍未得到释放。这篇综述的诞生,直击领域发展的三大核心痛点,有着不可替代的必要性:

行业发展碎片化,缺少全周期的系统梳理

过去数十年间,SAR ATR 领域已有多篇综述,但大多局限于单一维度:要么仅聚焦传统物理驱动的手工特征方法,要么只针对深度学习时代的特定任务,更有大量研究仅围绕舰船、飞机等单一目标类型展开。没有任何一项工作,系统追溯了 SAR ATR 从 1970s 至今五十年的完整技术演化,更未能厘清传统物理机理在现代深度学习框架中的传承与革新,导致领域研究出现 物理机理与数据驱动的脱节问题。

核心瓶颈长期未解,研究方向缺少清晰指引

五十年发展中,SAR ATR 始终面临着固有挑战:相干斑噪声、几何畸变带来的图像质量退化,目标姿态、成像参数带来的外观剧烈变化,数据采集与专业标注的极高成本,大场景与小 / 弱目标的极端不平衡,以及模型泛化性差、边缘部署受限等工程难题。现有研究大多聚焦单点技术突破,缺少对 “哪些问题已解决、哪些仍是核心瓶颈” 的系统性界定,导致大量研究重复内卷,难以实现关键技术的实质性突破。

开源生态严重滞后,领域发展缺少公平基准

综述数据显示,2020-2024 年遥感领域年发文量已与计算机视觉(CV)领域持平,差距不足 10%,但遥感领域开源代码仓库数量仅为 CV 领域的四分之一。SAR ATR 领域更是长期面临代码可复现性差、数据集分散、评估基准不统一的问题,大幅抬高了研究门槛,阻碍了技术的快速迭代与规模化落地。

为充分挖掘人工智能在 SAR 图像理解中的应用价值,科研界亟需重新思考如何实现人工智能与 SAR 图像解译的双向赋能,并力争在关键技术瓶颈上取得实质性突破。在此技术高速发展的背景下,本文首次对 SAR ATR 技术展开全面综述,梳理了该领域过去五十年的发展历程与重要里程碑,为科研界提供了清晰的发展路线图。本综述涵盖了约 250 项相关研究成果,系统阐述了 SAR ATR 的核心研究内容,包括领域核心挑战、重要数据集、代表性方法的优劣、评估指标及当前最优性能。最后,本文明确了该领域未来的潜在研究方向,并呼吁科研界重点关注三大核心基础方向:构建高质量大规模数据集、设计公平且全面的评估基准、培育安全的开源生态系统。

从星载 SAR 到 AI大模型:SAR ATR 的发展底色

SAR ATR 的核心任务,是从 SAR 图像中自动完成感兴趣目标的位置检测与类别精准分类,其经典架构由 Lincoln 实验室于 1993 年确立,分为预筛选、鉴别、分类三个递进阶段,最终实现从大场景 SAR 图像到目标级语义的精准提取。

图2 (a) SAR ATR的定义。该技术包含两个关键阶段:检测阶段,用于在大尺度SAR图像中定位潜在目标区域;分类阶段,对检测到的目标进行具体类别(如油轮)的分类。 (b) 光学图像与SAR图像的差异,以及SAR目标识别过程中的一些挑战性实例。

近五十年的发展中,SAR ATR 始终是遥感对地观测的核心基石。首先,SAR ATR具备广泛且不可替代的应用价值。在冰川研究领域,该技术是极地海冰监测与航行安全保障的关键手段,能有效识别冰山、冰间水道及海冰类型;在行星探测领域,其为月球与各类行星的表面结构分析提供了技术支撑;在全球变化研究领域,该技术可助力森林生物量估算、洪涝灾害评估与地表形变监测等工作。在公共安全与国防领域,SAR ATR技术在态势感知中发挥着不可或缺的作用。其次,SAR ATR技术作为从遥感影像中提取目标级语义信息的核心技术,其发展进步直接推动了更广泛的场景理解领域的研究。其三,SAR影像存在独特的相干斑噪声、几何畸变现象,且散射机制复杂,这使得人工目视解译的难度极大。微波感知与光学感知之间存在的语义鸿沟,是自动化解译技术发展的根本动因。其四,SAR ATR技术本身处于多学科交叉领域,吸引了来自人工智能、模式识别、地球科学、电磁学 以及信号处理领域的研究者投身其中,成为跨学科创新的活力平台。

如今,在海量遥感数据的涌现与大模型、基础模型、智能体技术的快速突破双重驱动下,该领域的发展正处于关键节点。本文首次对合成孔径雷达自动目标识别技术展开全面综述,梳理了其五十年来的发展历程与重要里程碑,为相关研究者提供了清晰的研究路线图。

图3:20 世纪 90 年代至今的 SAR ATR 技术进化树,基于目标类型分为四个主要分支:舰船、车辆、飞机及其他目标。分支节点代表标志性方法,连接线体现技术传承与创新,跨分支关联则标志着通用模型的出现。