人工智能在军事中的应用越来越受到各国的重视,包括但不限于雷达通信电子战领域。随着电磁环境的日益复杂,雷达通信电子战设备中新技术的应用,传统电子战系统已难以满足日益增加的对抗需求。
基于认知电子战的干扰策略优化是认知电子战系统进行自适应对抗的体现,也是认知电子战技术的核心优势。认知电子战中的干扰策略优化具体包括3方面的内容:干扰样式决策、干扰波形优化以及干扰资源调度。
自适应干扰样式决策是指对抗系统能够通过对目标信号的威胁感知建立对抗目标多种状态与已有干扰样式之间的最佳对应关系,从而能够针对目标的不同状态形成一套最优干扰策略。 认知电子战中的对抗目标往往具有多种工作状态且状态之间在对抗过程中可以快速切换、灵活变化,因此,需要对抗系统能够通过自适应的干扰样式决策建立目标状态与已有干扰样式之间的最佳对应关系,从而能够针对灵活变化的目标进行快速干扰响应。 自适应的干扰样式决策可通过强化学习技术解决。强化学习是人工智能领域中一类重要的学习方法,它通过“试错机制”来学习如何最佳地匹配状态和动作,以期获得最大的回报。强化学习具有自主学习的能力,它不依赖先验知识,仅通过不断与环境交互来获得知识,自主地进行动作选择,使得到奖励的行为被“强化”而受到惩罚的行为被“弱化”。常用的强化学习算法包括:动态规划、蒙特卡罗方法、时序差分学习、Q-学习、SARSA等。 自适应干扰波形优化是指对抗系统能够根据外界电磁环境的变化,充分利用我方的干扰资源,自主地、动态地、实时地优化生成新的干扰波形,从而形成灵活多变的干扰样式,以适应现代电子战复杂的电磁环境; 当对抗过程中出现未知威胁目标或目标未知状态时,已有的干扰样式可能无法达到最佳的干扰效果, 这时就需要对抗系统根据感知到的未知状态的信号特征,动态地调整干扰参数、优化干扰波形,从而生成新的干扰样式。 自适应的干扰波形优化可采用启发式优化算法解决。已有的启发式优化方法主要包括遗传算法、模拟退火算法、粒子群算法、差分进化算法、快速多层多极 子算法等。在认知电子战的应用条件下,优化过程需要考虑目标的威胁程度、匹配干扰策略及干扰实施参数等诸多因素,对传统算法的改进并实现数学模型化是算 法研究的关键内容。 自适应干扰资源调度则是在“多对多”对抗的条件下,合理分配干扰资源,使得对抗系统能够使我方既有的干扰资源在面对目标组网信息系统时发挥最大的作战效益。 在完成“一对一 ”对抗中干扰波形优化的基础上,进一步研究“多对多”对抗中的干扰资源调度问题。基于认知理论,研究对抗资源分配、调度的实现机制,尽可能减少系统对人和先验知识的依赖,以最大限度地提高对抗系统的资源利用效率。 在自适应的干扰资源调度方面,已有算法包括匈牙利算法、动态规划算法、模糊多属性动态规划算法等。认知电子对抗系统对干扰资源调度的智能化实现提出了更高的要求,需要研究新算法或对已有算法进行改进推广,以适应复杂的现代战场环境。 如随着对抗目标数量增多乃至组网,干扰机也大多具有干扰多个目标的能力,可以对结合自主学习知识库和预装专家系统的干扰调度算法进行研究,使其能够适用于“多对多”对抗的现代复杂战场环境。 2010年DARPA发布了“自适应电子战行为学习”(BLADE)项目,开发组网式电子攻击系统,通过实时检测分析无线通信系统,并对检测到的威胁生成有效的自适应对抗措施。这是首次将“认知无线电”用于通信电子战。
2012年DARPA又启动了“自适应雷达对抗”(ARC)项目,旨在开发能对抗敌方自适应雷达的机载电子战系统。自适应雷达是指那些在波束控制、波形、频率、相参处理周期等特征上进行捷变的多功能相控阵雷达。ARC系统则需要首先识别出辐射源类型、雷达功能(搜索/跟踪/识别)、雷达行为等威胁环境,然后快速生成干扰对策,并能对对抗效果进行评估。
原文始发于微信公众号(雷达通信电子战):