Fifty Years of Object Detection and Recognition from Synthetic Aperture Radar Remote Sensing Imagery: The Road Forward

Tariky

2026-03-08

学术研究> 团队成果

论文, SAR, 遥感

147 26.4~34.0 分钟 11901

基本信息

公众号：https://mp.weixin.qq.com/s/yTo02hqzgkc2NFtIMiWGgQ
论文：https://arxiv.org/abs/2509.22159
发表： https://arxiv.org
代码：https://github.com/JoyeZLearning/SAR-ATR-From-Beginning-to-Present
单位：国防科技大学
作者：周洁、刘永祥、刘丽、李玮杰、彭渤文、宋娅菲、匡纲要、黎湘
日期：2025年9月26日

为什么我们迫切需要这篇五十年全景综述？

图 1. SAR ATR的重要性。（a）2020年至2024年，遥感（RS）和计算机视觉（CV）领域每年发表的论文数量已达到相近水平（差距小于10%）。然而，GitHub上公开的与遥感相关的代码库数量仍然相对有限，仅约占计算机视觉领域的四分之一。这种差异凸显了遥感界在推进开源生态系统发展方面存在巨大的未开发潜力。（b）2020年至2024年遥感相关论文中最常见的关键词。每个单词的大小与出现频率成正比，这表明合成孔径雷达（SAR）、图像分类和目标检测等概念受到了广泛关注。（c）SAR ATR在极地海冰监测、深空探测、森林/洪水/形变监测，以及公共安全等方面得到了广泛应用且不可替代。（所有论文数量统计数据均来自Web of Science核心合集数据库。

合成孔径雷达（SAR）成像可在几乎所有天气和光照条件下对目标进行观测，已成为目标与场景分析和识别领域中不可或缺的信息获取手段。合成孔径雷达自动目标识别（SAR ATR）是遥感图像分析领域最基础且极具挑战性的研究问题之一。如今，以大模型和智能体为代表的人工智能技术重构了研究范式，对各研究领域产生了深远影响，并正以前所未有的速度持续发展。然而，人工智能技术在 SAR 图像解译中的巨大潜力仍未得到释放。这篇综述的诞生，直击领域发展的三大核心痛点，有着不可替代的必要性：

行业发展碎片化，缺少全周期的系统梳理

过去数十年间，SAR ATR 领域已有多篇综述，但大多局限于单一维度：要么仅聚焦传统物理驱动的手工特征方法，要么只针对深度学习时代的特定任务，更有大量研究仅围绕舰船、飞机等单一目标类型展开。没有任何一项工作，系统追溯了 SAR ATR 从 1970s 至今五十年的完整技术演化，更未能厘清传统物理机理在现代深度学习框架中的传承与革新，导致领域研究出现物理机理与数据驱动的脱节问题。

核心瓶颈长期未解，研究方向缺少清晰指引

五十年发展中，SAR ATR 始终面临着固有挑战：相干斑噪声、几何畸变带来的图像质量退化，目标姿态、成像参数带来的外观剧烈变化，数据采集与专业标注的极高成本，大场景与小 / 弱目标的极端不平衡，以及模型泛化性差、边缘部署受限等工程难题。现有研究大多聚焦单点技术突破，缺少对 “哪些问题已解决、哪些仍是核心瓶颈” 的系统性界定，导致大量研究重复内卷，难以实现关键技术的实质性突破。

开源生态严重滞后，领域发展缺少公平基准

综述数据显示，2020-2024 年遥感领域年发文量已与计算机视觉（CV）领域持平，差距不足 10%，但遥感领域开源代码仓库数量仅为 CV 领域的四分之一。SAR ATR 领域更是长期面临代码可复现性差、数据集分散、评估基准不统一的问题，大幅抬高了研究门槛，阻碍了技术的快速迭代与规模化落地。

为充分挖掘人工智能在 SAR 图像理解中的应用价值，科研界亟需重新思考如何实现人工智能与 SAR 图像解译的双向赋能，并力争在关键技术瓶颈上取得实质性突破。在此技术高速发展的背景下，本文首次对 SAR ATR 技术展开全面综述，梳理了该领域过去五十年的发展历程与重要里程碑，为科研界提供了清晰的发展路线图。本综述涵盖了约 250 项相关研究成果，系统阐述了 SAR ATR 的核心研究内容，包括领域核心挑战、重要数据集、代表性方法的优劣、评估指标及当前最优性能。最后，本文明确了该领域未来的潜在研究方向，并呼吁科研界重点关注三大核心基础方向：构建高质量大规模数据集、设计公平且全面的评估基准、培育安全的开源生态系统。

从星载 SAR 到 AI大模型：SAR ATR 的发展底色

SAR ATR 的核心任务，是从 SAR 图像中自动完成感兴趣目标的位置检测与类别精准分类，其经典架构由 Lincoln 实验室于 1993 年确立，分为预筛选、鉴别、分类三个递进阶段，最终实现从大场景 SAR 图像到目标级语义的精准提取。

图 2. (a) SAR ATR的定义。该技术包含两个关键阶段：检测阶段，用于在大尺度SAR图像中定位潜在目标区域；分类阶段，对检测到的目标进行具体类别（如油轮）的分类。 (b) 光学图像与SAR图像的差异，以及SAR目标识别过程中的一些挑战性实例。

近五十年的发展中，SAR ATR 始终是遥感对地观测的核心基石。首先，SAR ATR具备广泛且不可替代的应用价值。在冰川研究领域，该技术是极地海冰监测与航行安全保障的关键手段，能有效识别冰山、冰间水道及海冰类型；在行星探测领域，其为月球与各类行星的表面结构分析提供了技术支撑；在全球变化研究领域，该技术可助力森林生物量估算、洪涝灾害评估与地表形变监测等工作。在公共安全与国防领域，SAR ATR技术在态势感知中发挥着不可或缺的作用。其次，SAR ATR技术作为从遥感影像中提取目标级语义信息的核心技术，其发展进步直接推动了更广泛的场景理解领域的研究。其三，SAR影像存在独特的相干斑噪声、几何畸变现象，且散射机制复杂，这使得人工目视解译的难度极大。微波感知与光学感知之间存在的语义鸿沟，是自动化解译技术发展的根本动因。其四，SAR ATR技术本身处于多学科交叉领域，吸引了来自人工智能、模式识别、地球科学、电磁学以及信号处理领域的研究者投身其中，成为跨学科创新的活力平台。

如今，在海量遥感数据的涌现与大模型、基础模型、智能体技术的快速突破双重驱动下，该领域的发展正处于关键节点。本文首次对合成孔径雷达自动目标识别技术展开全面综述，梳理了其五十年来的发展历程与重要里程碑，为相关研究者提供了清晰的研究路线图。

图 3. 20 世纪 90 年代至今的 SAR ATR 技术进化树，基于目标类型分为四个主要分支：舰船、车辆、飞机及其他目标。分支节点代表标志性方法，连接线体现技术传承与创新，跨分支关联则标志着通用模型的出现。

五大核心贡献

前所未有的全面性：首次覆盖五十年完整发展历程

综述首次系统追溯了 SAR ATR 从 1970s 的统计理论基础，到如今物理融合基础模型的全周期发展，梳理了近 250 篇领域代表性研究成果，完整覆盖了 SAR ATR 的核心挑战、经典数据集、代表性方法优劣、评估指标与 SOTA 性能，是领域内时间跨度最长、覆盖范围最广的综述工作。

直击本质的传承性：打通物理机理与深度学习的底层脉络

综述首次深度剖析了散射中心模型、CFAR 检测等传统经典物理概念，如何在现代深度学习框架中被吸收、重构与再创新，揭示了技术范式变革背后的学术连续性，彻底打破了 “传统方法与深度学习割裂” 的行业困境，为 “物理先验 + 数据驱动” 的融合发展提供了理论参考。

逻辑严谨的系统性：构建核心挑战的完整分类体系

综述将 SAR ATR 的核心挑战划分为数据相关与技术相关两大维度，清晰界定了每一项挑战的解决程度与未解难题，明确了领域未来的核心攻坚议程，让后续研究能够精准锚定真问题、解决真痛点，避免重复研究。

生态共建的开放性：构建可复现研究资源库

整理并开源了主流数据集、代码仓库及文献列表，推动领域研究的可复现性与快速迭代。访问地址：https://github.com/JoyeZLearning/SAR-ATR-From-Beginning-to-Present。

立足长远的前瞻性：绘制未来发展的清晰路线图

基于五十年的技术发展规律，综述精准提炼了基础模型、主动学习、边云协同智能等前沿研究方向，并明确了领域未来发展的三大核心支柱：高质量大规模数据集的构建、公平全面的评估基准设计、安全可持续的开源生态培育，为 SAR ATR 领域发展划定了核心航道。

核心挑战：数据与技术的双重瓶颈

数据相关挑战

质量退化
- 相干斑噪声（Speckle Noise）是SAR固有的乘性噪声，严重干扰边缘和纹理；
- 几何畸变（叠掩、阴影、透视收缩）导致目标形状失真；
- 射频干扰（RFI）可能完全淹没目标信号。
目标多变
SAR成像对视角极度敏感。同一辆坦克，方位角变化几度，其散射点分布可能完全不同（“同物不同谱”）；俯仰角变化也会导致目标结构特征剧烈变化。
标注昂贵
SAR图像解译需要极高的专业知识，标注成本远高于光学图像。这导致现有数据集规模小、类别少，且存在严重的长尾分布（常见目标多，稀有目标极少）。
大小目标失衡
在广域监视场景中，感兴趣的小目标（如车辆）占比极低，极易被广阔的背景杂波淹没，导致漏检率高。

技术相关挑战

泛化性弱
模型在训练集外（如不同传感器、不同成像参数、新地理环境）性能急剧下降，“过拟合”现象严重。
可解释性差
深度学习黑盒难以满足国防安全等高可靠性场景的需求。指挥官需要知道“为什么模型认为这是坦克”，而不仅仅是一个概率值。
边缘部署难
星载、机载平台算力、功耗严格受限，而当前高性能大模型参数量巨大，难以实时运行

一文读懂SAR ATR 五十年技术演化全脉络

综述以 “特征表示” 为核心线索，将 SAR ATR 五十年发展划分为四个里程碑阶段，完整还原了技术演化的全链条，同时对检测、分类两大核心任务的技术发展进行了系统性梳理。

图 5. SAR ATR技术演进的时间轴里程碑，涵盖分类与检测两大核心任务，从物理原理理解、特征设计、特征学习到特征理解与学习。

四大技术范式变革，定义五十年发展主线

物理机理理解阶段（1970s-1990s）：奠定理论根基

这一阶段以电磁散射物理机制建模与统计理论为核心，完成了SAR 成像与目标识别的理论奠基。1951 年 Carl Wiley 提出合成孔径成像的多普勒波束锐化原理，1978 年 Seasat-A 卫星发射后，实测数据推动了相干斑噪声统计建模、K 分布等核心理论的发展，CA-CFAR 检测框架将奈曼 - 皮尔逊准则转化为自适应阈值算法，实现了恒定虚警率下的自动目标检测，为 SAR ATR 的工程化落地奠定了理论基础。

手工特征设计阶段（1990s-2010s）：构建经典技术框架

1993 年 Lincoln 实验室提出 SAR ATR 三阶段经典处理流水线，确立了领域的算法架构；1996 年 MSTAR 数据集发布，为算法验证提供了标准化基准。这一阶段的核心是领域专家基于物理先验设计手工特征，包括属性散射中心（ASC）为代表的物理特征、灰度共生矩阵（GLCM）为代表的纹理特征、小波变换为代表的结构特征，结合 SVM、AdaBoost、稀疏表示等传统机器学习方法，实现了从目标检测到细粒度分类的技术拓展。

特征自主学习阶段（2010s-2020s）：深度学习全面革新

以卷积神经网络（CNN）为核心的深度学习技术全面引入，彻底改变了 SAR ATR 的技术范式。核心突破在于通过深度神经网络直接从原始 SAR 图像中学习层级化特征表示，摆脱了对专家手工特征的强依赖。这一阶段，A-ConvNets 验证了 CNN 在 SAR 目标分类的有效性，复值 CNN（CV-CNN）将 SAR 复数据的相位信息纳入端到端学习，FEC 框架首次实现了电磁散射特征与 CNN 深度特征的有效融合，同时也暴露了深度学习对大规模标注数据的强依赖、模型可解释性差等核心问题。

物理-数据双驱动融合阶段（2020s - 至今）：迈向可解释通用智能

SAR ATR 进入物理引导与数据驱动深度融合的新阶段。在数据层面，大规模多任务数据集为通用模型提供了基础；在架构层面，Vision Transformer、状态空间模型、扩散模型等新兴架构，将电磁散射原理深度嵌入网络设计；在学习范式层面，自监督学习、跨域预训练大幅降低了模型对标注数据的依赖，检测、识别、分割等任务可在统一的基础模型上完成灵活适配，推动 SAR ATR 向高性能、可解释、强鲁棒性的通用识别系统演进。

两大核心任务：检测与分类的技术演进全景

综述对 SAR 目标检测、目标分类两大核心任务，分别构建了完整的方法分类体系，系统梳理了从传统方法到深度学习方法的技术演进与性能表现。

SAR目标检测：从统计假设检验到端到端智能检测

检测任务的核心挑战，是在强相干斑、复杂背景中精准分离目标并抑制虚警。综述将其划分为传统方法与深度学习方法两大分支。

传统方法
以 CFAR 检测家族为核心，基于统计假设检验实现像素级目标检测，衍生出参数化 CFAR、杂波估计 CFAR 等多类变体，同时发展出基于视觉显著性、子孔径相干性的非统计特征方法，至今仍是 SAR 检测的基础框架；
深度学习方法
分为 anchor-based 与 anchor-free 两大类，前者包括两阶段的 Faster R-CNN 系列、一阶段的 YOLO/DRBox-v2 系列，后者则以 CenterNet、FCOS、DETR 类架构为核心，解决了 SAR 目标旋转、多尺度、小目标检测的核心难题。综述系统对比了主流方法在 SSDD、HRSID 等 6 大主流数据集的 SOTA 性能，其中 SFS-CNet 在 SSDD 数据集上 mAP50 达到 99.6%，MaDiNet 在多类数据集上均实现了领先性能。

SAR 目标分类：从手工特征到物理可解释深度特征

分类任务的核心，是提取具有判别性、鲁棒性的目标特征。综述同样构建了传统方法与深度学习方法的完整分类体系。

传统方法
分为强度特征、纹理特征、散射建模特征、结构建模特征四大类，核心是通过专家先验提取物理可解释的特征，结合浅层分类器实现目标分类，奠定了 SAR 分类的物理基础；
深度学习方法
分为强度统计特征、结构特征、电磁散射特征三大类，其中电磁散射特征相关方法实现了物理机理与深度学习的深度融合，复值 CNN、物理先验引导的网络设计，大幅提升了模型的可解释性与泛化性。在经典 MSTAR 数据集上，深度学习方法已实现近 100% 的分类精度，其中 MMFF 方法准确率达到 99.95%。

SAR ATR 最新研究进展全梳理

综述系统总结了近三年 SAR ATR 领域的三大前沿研究方向，全面呈现了领域最新的技术突破与发展热点：

基础模型：SAR 智能解译的新范式

基础模型已成为 SAR ATR 领域的核心研究热点，综述将其分为三大类：

通用基座赋能
直接将自然图像预训练大模型迁移至 SAR 任务，在分割任务中展现出优势，但存在显著的域间隙问题；
跨遥感行业通用模型
面向光学、SAR 等多源遥感数据的通用预训练模型，如 SkySense++ 在 12 个下游任务中实现 SOTA，但对 SAR 检测任务的探索不足；
SAR 垂直领域基础模型
针对 SAR 数据特性做专属设计，如 SARATR-X 通过两阶段自监督抑制相干斑噪声，SUMMIT 通过多任务学习增强散射机理理解，在更小的参数量下实现了检测任务的性能超越，但仍受限于预训练数据的规模与多样性。

同时，综述也指出了当前基础模型的核心瓶颈：架构缺少 SAR 专属设计、对复值数据与非高斯噪声的适配不足、预训练数据规模与多样性受限、缺少统一的评估基准。

有限数据学习：破解 SAR 标注稀缺的核心难题

SAR 图像标注需要电磁散射领域的专业知识，标注成本极高，少样本学习成为领域核心攻坚方向。综述从三个维度系统梳理了最新进展：

样本数量有限
通过元学习优化策略、基于成像几何的 SAR 数据仿真生成，解决少样本场景下的特征学习不稳定问题；
类别有限
通过类增量学习缓解模型 “灾难性遗忘”，通过开集识别实现未知类别与已知类别的精准区分，适配真实场景中目标类别持续扩展的需求；
分布有限
针对数据集长尾分布问题，通过加权损失函数、难样本挖掘、强化学习优化等方式，解决模型对少数类样本拟合不足的问题。

域自适应：提升模型跨场景泛化能力

SAR 图像统计特性对传感器、成像参数、观测视角高度敏感，分布偏移导致模型跨场景泛化性极差。综述梳理了域自适应技术的最新演进：从早期基于判别器、梯度反转层的全局特征对齐，发展到如今将域差异分解为散射拓扑、旋转角度等可解释性子问题，通过门控融合、动态卷积实现差异化补偿；同时，单域泛化相关研究也实现了零样本场景下的 SAR 知识迁移，为模型跨传感器、跨场景落地提供了核心技术支撑。

SAR ATR 发展蓝图

基于五十年的发展历程与当前技术瓶颈，综述从生态建设、理论模型算法、真实场景落地、系统安全四大维度，提出了 SAR ATR 领域未来发展的完整框架。

构建开放、共享、可持续的 SAR ATR 生态

数据与基准是 AI 时代 SAR ATR 发展的核心底座，综述提出三大核心抓手：

构建智能协同标注系统
基于多模态大模型与 SAR 领域知识图谱，打造人机协同的标注体系，通过标注 Agent 实现自动化预处理，降低标注成本、提升标注精度；
发展物理机制驱动的合成数据生成
将 SAR 成像机理与电磁散射模型深度嵌入生成网络，构建高保真仿真数据集，解决实测数据长尾分布、极端场景数据稀缺的问题；
建立统一的高质量数据集与评估基准
打造覆盖多维度指标、多类型任务、多复杂度场景的综合评估体系，呼吁学术界共建透明、可复现的开源生态，解决领域 “基准不统一、结果不可比、代码不可复现” 的核心痛点。

理论、模型与算法的八大前沿方向

综述明确了 SAR ATR 模型与算法未来的八大核心攻坚方向，实现从 “封闭场景识别” 到 “开放世界理解” 的跨越：

构建从垂直领域到行业级、多模态的 SAR 大模型体系；
研发 SAR 先验知识引导的、物理可解释的基础模型；
构建面向 SAR 的电磁世界模型，结合具身智能实现动态场景自适应；
发展标签高效学习范式，最大化利用有限标注资源；
引入不确定性量化，让模型具备感知自身预测可靠性的能力；
发展分布外（OOD）学习，让模型明确自身认知边界；
实现语言 - SAR 图像对齐，通过自然语言实现交互式 SAR 图像理解；
推进光学 - SAR 跨模态学习，实现多源数据的优势互补与知识迁移。

面向真实场景的工程化技术创新

针对 SAR ATR 从实验室到真实场景落地的 “最后一公里”，综述提出两大核心方向：

协同分布式智能
面向星载、机载、无人机等分布式平台，发展联邦学习、边云协同架构，实现通信约束下的高效知识共享，兼顾数据隐私与模型性能；
自主在线智能
通过模型量化、剪枝等压缩技术，实现资源受限端侧的高效推理；通过在线自适应、持续学习、人在回路的主动学习，让模型在部署后持续适配动态环境，实现全自主的 SAR ATR 系统。

构建全栈式安全可信SAR ATR系统

综述强调，安全可信是 SAR ATR 在关键任务中大规模部署的核心前提，需要从数据、模型、应用全流程构建安全体系：针对数据，防范数据注入、泄露与生成数据污染；针对模型，通过对抗训练提升鲁棒性，通过可解释性与不确定性量化实现决策可追溯；针对应用，保障边缘节点物理安全、人机交互真实性与多平台协同可信性，最终建立全面的系统可信性评估框架。

写在最后

五十年栉风沐雨，SAR ATR 从物理理论的奠基，到 AI 时代的爆发式发展，已成为遥感对地观测领域不可或缺的核心技术。这篇里程碑式的综述，不仅是对 SAR ATR 五十年发展历程的全面复盘与系统总结，更厘清了技术发展脉络、指明了未来的核心航向。

对于学术界而言，它是一份极具价值的 “入门指南” 与 “研究地图”，让研究者能够快速把握领域全貌，精准锚定核心科学问题；对于工业界而言，它是一份技术落地的 “参考手册”，清晰呈现了技术成熟度与工程化瓶颈，为 SAR 技术的规模化应用提供了全面参考。

我们也期待，这篇综述能够推动 SAR ATR 领域的开源生态建设与技术协同创新，让 SAR 在 AI 时代释放出更大的价值，为遥感对地观测、防灾减灾、深空探测、国土安全等领域的发展，注入更强劲的技术动力。

更多图表分析可见原文