Fifty Years of Object Detection and Recognition from Synthetic Aperture Radar Remote Sensing Imagery: The Road Forward
基本信息
代码:
https://github.com/JoyeZLearning/SAR-ATR-From-Beginning-to-Present 单位:国防科技大学
作者:周洁、刘永祥、刘丽、李玮杰、彭渤文、宋娅菲、匡纲要、黎湘
日期:2025年9月26日
为什么我们迫切需要这篇五十年全景综述?

合成孔径雷达(SAR)成像可在几乎所有天气和光照条件下对目标进行观测,已成为目标与场景分析和识别领域中不可或缺的信息获取手段。合成孔径雷达自动目标识别(SAR ATR)是遥感图像分析领域最基础且极具挑战性的研究问题之一。如今,以大模型和智能体为代表的人工智能技术重构了研究范式,对各研究领域产生了深远影响,并正以前所未有的速度持续发展。然而,人工智能技术在 SAR 图像解译中的巨大潜力仍未得到释放。这篇综述的诞生,直击领域发展的三大核心痛点,有着不可替代的必要性:
行业发展碎片化,缺少全周期的系统梳理
过去数十年间,SAR ATR 领域已有多篇综述,但大多局限于单一维度:要么仅聚焦传统物理驱动的手工特征方法,要么只针对深度学习时代的特定任务,更有大量研究仅围绕舰船、飞机等单一目标类型展开。没有任何一项工作,系统追溯了 SAR ATR 从 1970s 至今五十年的完整技术演化,更未能厘清传统物理机理在现代深度学习框架中的传承与革新,导致领域研究出现 物理机理与数据驱动的脱节问题。
核心瓶颈长期未解,研究方向缺少清晰指引
五十年发展中,SAR ATR 始终面临着固有挑战:相干斑噪声、几何畸变带来的图像质量退化,目标姿态、成像参数带来的外观剧烈变化,数据采集与专业标注的极高成本,大场景与小 / 弱目标的极端不平衡,以及模型泛化性差、边缘部署受限等工程难题。现有研究大多聚焦单点技术突破,缺少对 “哪些问题已解决、哪些仍是核心瓶颈” 的系统性界定,导致大量研究重复内卷,难以实现关键技术的实质性突破。
开源生态严重滞后,领域发展缺少公平基准
综述数据显示,2020-2024 年遥感领域年发文量已与计算机视觉(CV)领域持平,差距不足 10%,但遥感领域开源代码仓库数量仅为 CV 领域的四分之一。SAR ATR 领域更是长期面临代码可复现性差、数据集分散、评估基准不统一的问题,大幅抬高了研究门槛,阻碍了技术的快速迭代与规模化落地。
为充分挖掘人工智能在 SAR 图像理解中的应用价值,科研界亟需重新思考如何实现人工智能与 SAR 图像解译的双向赋能,并力争在关键技术瓶颈上取得实质性突破。在此技术高速发展的背景下,本文首次对 SAR ATR 技术展开全面综述,梳理了该领域过去五十年的发展历程与重要里程碑,为科研界提供了清晰的发展路线图。本综述涵盖了约 250 项相关研究成果,系统阐述了 SAR ATR 的核心研究内容,包括领域核心挑战、重要数据集、代表性方法的优劣、评估指标及当前最优性能。最后,本文明确了该领域未来的潜在研究方向,并呼吁科研界重点关注三大核心基础方向:构建高质量大规模数据集、设计公平且全面的评估基准、培育安全的开源生态系统。
从星载 SAR 到 AI大模型:SAR ATR 的发展底色
SAR ATR 的核心任务,是从 SAR 图像中自动完成感兴趣目标的位置检测与类别精准分类,其经典架构由 Lincoln 实验室于 1993 年确立,分为预筛选、鉴别、分类三个递进阶段,最终实现从大场景 SAR 图像到目标级语义的精准提取。

近五十年的发展中,SAR ATR 始终是遥感对地观测的核心基石。首先,SAR ATR具备广泛且不可替代的应用价值。在冰川研究领域,该技术是极地海冰监测与航行安全保障的关键手段,能有效识别冰山、冰间水道及海冰类型;在行星探测领域,其为月球与各类行星的表面结构分析提供了技术支撑;在全球变化研究领域,该技术可助力森林生物量估算、洪涝灾害评估与地表形变监测等工作。在公共安全与国防领域,SAR ATR技术在态势感知中发挥着不可或缺的作用。其次,SAR ATR技术作为从遥感影像中提取目标级语义信息的核心技术,其发展进步直接推动了更广泛的场景理解领域的研究。其三,SAR影像存在独特的相干斑噪声、几何畸变现象,且散射机制复杂,这使得人工目视解译的难度极大。微波感知与光学感知之间存在的语义鸿沟,是自动化解译技术发展的根本动因。其四,SAR ATR技术本身处于多学科交叉领域,吸引了来自人工智能、模式识别、地球科学、电磁学 以及信号处理领域的研究者投身其中,成为跨学科创新的活力平台。
如今,在海量遥感数据的涌现与大模型、基础模型、智能体技术的快速突破双重驱动下,该领域的发展正处于关键节点。本文首次对合成孔径雷达自动目标识别技术展开全面综述,梳理了其五十年来的发展历程与重要里程碑,为相关研究者提供了清晰的研究路线图。

五大核心贡献
前所未有的全面性:首次覆盖五十年完整发展历程
综述首次系统追溯了 SAR ATR 从 1970s 的统计理论基础,到如今物理融合基础模型的全周期发展,梳理了近 250 篇领域代表性研究成果,完整覆盖了 SAR ATR 的核心挑战、经典数据集、代表性方法优劣、评估指标与 SOTA 性能,是领域内时间跨度最长、覆盖范围最广的综述工作。
直击本质的传承性:打通物理机理与深度学习的底层脉络
综述首次深度剖析了散射中心模型、CFAR 检测等传统经典物理概念,如何在现代深度学习框架中被吸收、重构与再创新,揭示了技术范式变革背后的学术连续性,彻底打破了 “传统方法与深度学习割裂” 的行业困境,为 “物理先验 + 数据驱动” 的融合发展提供了理论参考。
逻辑严谨的系统性:构建核心挑战的完整分类体系
综述将 SAR ATR 的核心挑战划分为数据相关与技术相关两大维度,清晰界定了每一项挑战的解决程度与未解难题,明确了领域未来的核心攻坚议程,让后续研究能够精准锚定真问题、解决真痛点,避免重复研究。
生态共建的开放性:构建可复现研究资源库
整理并开源了主流数据集、代码仓库及文献列表,推动领域研究的可复现性与快速迭代。访问地址:
立足长远的前瞻性:绘制未来发展的清晰路线图
基于五十年的技术发展规律,综述精准提炼了基础模型、主动学习、边云协同智能等前沿研究方向,并明确了领域未来发展的三大核心支柱:高质量大规模数据集的构建、公平全面的评估基准设计、安全可持续的开源生态培育,为 SAR ATR 领域发展划定了核心航道。
核心挑战:数据与技术的双重瓶颈

数据相关挑战
质量退化
相干斑噪声(Speckle Noise)是SAR固有的乘性噪声,严重干扰边缘和纹理;
几何畸变(叠掩、阴影、透视收缩)导致目标形状失真;
射频干扰(RFI)可能完全淹没目标信号。
目标多变
SAR成像对视角极度敏感。同一辆坦克,方位角变化几度,其散射点分布可能完全不同(“同物不同谱”);俯仰角变化也会导致目标结构特征剧烈变化。标注昂贵
SAR图像解译需要极高的专业知识,标注成本远高于光学图像。这导致现有数据集规模小、类别少,且存在严重的长尾分布(常见目标多,稀有目标极少)。大小目标失衡
在广域监视场景中,感兴趣的小目标(如车辆)占比极低,极易被广阔的背景杂波淹没,导致漏检率高。
技术相关挑战
泛化性弱
模型在训练集外(如不同传感器、不同成像参数、新地理环境)性能急剧下降,“过拟合”现象严重。可解释性差
深度学习黑盒难以满足国防安全等高可靠性场景的需求。指挥官需要知道“为什么模型认为这是坦克”,而不仅仅是一个概率值。边缘部署难
星载、机载平台算力、功耗严格受限,而当前高性能大模型参数量巨大,难以实时运行
一文读懂SAR ATR 五十年技术演化全脉络
综述以 “特征表示” 为核心线索,将 SAR ATR 五十年发展划分为四个里程碑阶段,完整还原了技术演化的全链条,同时对检测、分类两大核心任务的技术发展进行了系统性梳理。

四大技术范式变革,定义五十年发展主线
物理机理理解阶段(1970s-1990s):奠定理论根基
这一阶段以电磁散射物理机制建模与统计理论为核心,完成了SAR 成像与目标识别的理论奠基。1951 年 Carl Wiley 提出合成孔径成像的多普勒波束锐化原理,1978 年 Seasat-A 卫星发射后,实测数据推动了相干斑噪声统计建模、K 分布等核心理论的发展,CA-CFAR 检测框架将奈曼 - 皮尔逊准则转化为自适应阈值算法,实现了恒定虚警率下的自动目标检测,为 SAR ATR 的工程化落地奠定了理论基础。
手工特征设计阶段(1990s-2010s):构建经典技术框架
1993 年 Lincoln 实验室提出 SAR ATR 三阶段经典处理流水线,确立了领域的算法架构;1996 年 MSTAR 数据集发布,为算法验证提供了标准化基准。这一阶段的核心是领域专家基于物理先验设计手工特征,包括属性散射中心(ASC)为代表的物理特征、灰度共生矩阵(GLCM)为代表的纹理特征、小波变换为代表的结构特征,结合 SVM、AdaBoost、稀疏表示等传统机器学习方法,实现了从目标检测到细粒度分类的技术拓展。
特征自主学习阶段(2010s-2020s):深度学习全面革新
以卷积神经网络(CNN)为核心的深度学习技术全面引入,彻底改变了 SAR ATR 的技术范式。核心突破在于通过深度神经网络直接从原始 SAR 图像中学习层级化特征表示,摆脱了对专家手工特征的强依赖。这一阶段,A-ConvNets 验证了 CNN 在 SAR 目标分类的有效性,复值 CNN(CV-CNN)将 SAR 复数据的相位信息纳入端到端学习,FEC 框架首次实现了电磁散射特征与 CNN 深度特征的有效融合,同时也暴露了深度学习对大规模标注数据的强依赖、模型可解释性差等核心问题。
物理-数据双驱动融合阶段(2020s - 至今):迈向可解释通用智能
SAR ATR 进入物理引导与数据驱动深度融合的新阶段。在数据层面,大规模多任务数据集为通用模型提供了基础;在架构层面,Vision Transformer、状态空间模型、扩散模型等新兴架构,将电磁散射原理深度嵌入网络设计;在学习范式层面,自监督学习、跨域预训练大幅降低了模型对标注数据的依赖,检测、识别、分割等任务可在统一的基础模型上完成灵活适配,推动 SAR ATR 向高性能、可解释、强鲁棒性的通用识别系统演进。
两大核心任务:检测与分类的技术演进全景
综述对 SAR 目标检测、目标分类两大核心任务,分别构建了完整的方法分类体系,系统梳理了从传统方法到深度学习方法的技术演进与性能表现。
SAR目标检测:从统计假设检验到端到端智能检测
检测任务的核心挑战,是在强相干斑、复杂背景中精准分离目标并抑制虚警。综述将其划分为传统方法与深度学习方法两大分支。

传统方法
以 CFAR 检测家族为核心,基于统计假设检验实现像素级目标检测,衍生出参数化 CFAR、杂波估计 CFAR 等多类变体,同时发展出基于视觉显著性、子孔径相干性的非统计特征方法,至今仍是 SAR 检测的基础框架;深度学习方法
分为 anchor-based 与 anchor-free 两大类,前者包括两阶段的 Faster R-CNN 系列、一阶段的 YOLO/DRBox-v2 系列,后者则以 CenterNet、FCOS、DETR 类架构为核心,解决了 SAR 目标旋转、多尺度、小目标检测的核心难题。综述系统对比了主流方法在 SSDD、HRSID 等 6 大主流数据集的 SOTA 性能,其中 SFS-CNet 在 SSDD 数据集上 mAP50 达到 99.6%,MaDiNet 在多类数据集上均实现了领先性能。

SAR 目标分类:从手工特征到物理可解释深度特征
分类任务的核心,是提取具有判别性、鲁棒性的目标特征。综述同样构建了传统方法与深度学习方法的完整分类体系。

传统方法
分为强度特征、纹理特征、散射建模特征、结构建模特征四大类,核心是通过专家先验提取物理可解释的特征,结合浅层分类器实现目标分类,奠定了 SAR 分类的物理基础;深度学习方法
分为强度统计特征、结构特征、电磁散射特征三大类,其中电磁散射特征相关方法实现了物理机理与深度学习的深度融合,复值 CNN、物理先验引导的网络设计,大幅提升了模型的可解释性与泛化性。在经典 MSTAR 数据集上,深度学习方法已实现近 100% 的分类精度,其中 MMFF 方法准确率达到 99.95%。
SAR ATR 最新研究进展全梳理
综述系统总结了近三年 SAR ATR 领域的三大前沿研究方向,全面呈现了领域最新的技术突破与发展热点:
基础模型:SAR 智能解译的新范式
基础模型已成为 SAR ATR 领域的核心研究热点,综述将其分为三大类:
通用基座赋能
直接将自然图像预训练大模型迁移至 SAR 任务,在分割任务中展现出优势,但存在显著的域间隙问题;跨遥感行业通用模型
面向光学、SAR 等多源遥感数据的通用预训练模型,如 SkySense++ 在 12 个下游任务中实现 SOTA,但对 SAR 检测任务的探索不足;SAR 垂直领域基础模型
针对 SAR 数据特性做专属设计,如 SARATR-X 通过两阶段自监督抑制相干斑噪声,SUMMIT 通过多任务学习增强散射机理理解,在更小的参数量下实现了检测任务的性能超越,但仍受限于预训练数据的规模与多样性。
同时,综述也指出了当前基础模型的核心瓶颈:架构缺少 SAR 专属设计、对复值数据与非高斯噪声的适配不足、预训练数据规模与多样性受限、缺少统一的评估基准。
有限数据学习:破解 SAR 标注稀缺的核心难题
SAR 图像标注需要电磁散射领域的专业知识,标注成本极高,少样本学习成为领域核心攻坚方向。综述从三个维度系统梳理了最新进展:
样本数量有限
通过元学习优化策略、基于成像几何的 SAR 数据仿真生成,解决少样本场景下的特征学习不稳定问题;类别有限
通过类增量学习缓解模型 “灾难性遗忘”,通过开集识别实现未知类别与已知类别的精准区分,适配真实场景中目标类别持续扩展的需求;分布有限
针对数据集长尾分布问题,通过加权损失函数、难样本挖掘、强化学习优化等方式,解决模型对少数类样本拟合不足的问题。
域自适应:提升模型跨场景泛化能力
SAR 图像统计特性对传感器、成像参数、观测视角高度敏感,分布偏移导致模型跨场景泛化性极差。综述梳理了域自适应技术的最新演进:从早期基于判别器、梯度反转层的全局特征对齐,发展到如今将域差异分解为散射拓扑、旋转角度等可解释性子问题,通过门控融合、动态卷积实现差异化补偿;同时,单域泛化相关研究也实现了零样本场景下的 SAR 知识迁移,为模型跨传感器、跨场景落地提供了核心技术支撑。
SAR ATR 发展蓝图
基于五十年的发展历程与当前技术瓶颈,综述从生态建设、理论模型算法、真实场景落地、系统安全四大维度,提出了 SAR ATR 领域未来发展的完整框架。

构建开放、共享、可持续的 SAR ATR 生态
数据与基准是 AI 时代 SAR ATR 发展的核心底座,综述提出三大核心抓手:
构建智能协同标注系统
基于多模态大模型与 SAR 领域知识图谱,打造人机协同的标注体系,通过标注 Agent 实现自动化预处理,降低标注成本、提升标注精度;发展物理机制驱动的合成数据生成
将 SAR 成像机理与电磁散射模型深度嵌入生成网络,构建高保真仿真数据集,解决实测数据长尾分布、极端场景数据稀缺的问题;建立统一的高质量数据集与评估基准
打造覆盖多维度指标、多类型任务、多复杂度场景的综合评估体系,呼吁学术界共建透明、可复现的开源生态,解决领域 “基准不统一、结果不可比、代码不可复现” 的核心痛点。
理论、模型与算法的八大前沿方向
综述明确了 SAR ATR 模型与算法未来的八大核心攻坚方向,实现从 “封闭场景识别” 到 “开放世界理解” 的跨越:
构建从垂直领域到行业级、多模态的 SAR 大模型体系;
研发 SAR 先验知识引导的、物理可解释的基础模型;
构建面向 SAR 的电磁世界模型,结合具身智能实现动态场景自适应;
发展标签高效学习范式,最大化利用有限标注资源;
引入不确定性量化,让模型具备感知自身预测可靠性的能力;
发展分布外(OOD)学习,让模型明确自身认知边界;
实现语言 - SAR 图像对齐,通过自然语言实现交互式 SAR 图像理解;
推进光学 - SAR 跨模态学习,实现多源数据的优势互补与知识迁移。
面向真实场景的工程化技术创新
针对 SAR ATR 从实验室到真实场景落地的 “最后一公里”,综述提出两大核心方向:
协同分布式智能
面向星载、机载、无人机等分布式平台,发展联邦学习、边云协同架构,实现通信约束下的高效知识共享,兼顾数据隐私与模型性能;自主在线智能
通过模型量化、剪枝等压缩技术,实现资源受限端侧的高效推理;通过在线自适应、持续学习、人在回路的主动学习,让模型在部署后持续适配动态环境,实现全自主的 SAR ATR 系统。
构建全栈式安全可信SAR ATR系统
综述强调,安全可信是 SAR ATR 在关键任务中大规模部署的核心前提,需要从数据、模型、应用全流程构建安全体系:针对数据,防范数据注入、泄露与生成数据污染;针对模型,通过对抗训练提升鲁棒性,通过可解释性与不确定性量化实现决策可追溯;针对应用,保障边缘节点物理安全、人机交互真实性与多平台协同可信性,最终建立全面的系统可信性评估框架。
写在最后
五十年栉风沐雨,SAR ATR 从物理理论的奠基,到 AI 时代的爆发式发展,已成为遥感对地观测领域不可或缺的核心技术。这篇里程碑式的综述,不仅是对 SAR ATR 五十年发展历程的全面复盘与系统总结,更厘清了技术发展脉络、指明了未来的核心航向。
对于学术界而言,它是一份极具价值的 “入门指南” 与 “研究地图”,让研究者能够快速把握领域全貌,精准锚定核心科学问题;对于工业界而言,它是一份技术落地的 “参考手册”,清晰呈现了技术成熟度与工程化瓶颈,为 SAR 技术的规模化应用提供了全面参考。
我们也期待,这篇综述能够推动 SAR ATR 领域的开源生态建设与技术协同创新,让 SAR 在 AI 时代释放出更大的价值,为遥感对地观测、防灾减灾、深空探测、国土安全等领域的发展,注入更强劲的技术动力。
更多图表分析可见原文