实验室李泽仁博士完成毕业答辩

暂无作者 2024-06-20 1727

2024620日,实验室博士生李泽仁顺利完成了毕业论文答辩工作。

论文题目:《面向目标跟踪的传感器管理方法》

论文摘要:

传感器管理是信息融合领域的一个重要研究方向。它通过对传感器系统的可控自由度进行管理,从而提升传感器探测整体效能以获得信息优势,在态势感知、环境监测和智能交通等多个方面具有广泛应用前景。目标跟踪是传感器管理的重要应用方向之一,面向目标跟踪的传感器管理主要关注传感器选择与传感器控制两方面内容。传感器选择以管理静平台传感器为背景,通过评估各传感器量测对目标跟踪效果的贡献,从而选择最优的一组传感器进行融合。传感器控制以管理动平台传感器为背景,通过评估传感器各动作对目标跟踪效果的影响,进而选取最佳传感器动作以改善观测。本文以目标跟踪为背景,研究传感器选择与传感器控制两类典型传感器管理问题。传感器管理是依据一定准则对传感器自由度进行优化的过程,传统方法使用信息论相关概念设计优化目标与对应的优化模型,仅适用于简单场景。目前,考虑到环境和系统中存在的种种非理想条件,面向目标跟踪的传感器管理仍存在以下挑战。一方面,在传感器选择方法的研究中,受恶劣气象与强电磁干扰影响,传感器量测可能出现不确定问题,同时传感器之间数据传输可能存在随机时延。现有的基于信息论目标函数的传感器选择模型不仅无法区分量测是否出现异常,也无法直接用于异步传感器选择。另一方面,在传感器控制方法的研究中,受限于有限的计算资源,分布式框架下的传感器控制与强化学习框架下的非短视传感器控制成为研究热点,但现有的基于信息论目标函数的传感器控制模型并不匹配上述框架,传感器控制效果有待提高。本文围绕上述挑战,展开了以下研究:

1.    针对量测不确定条件下的传感器选择问题,提出一种基于信息一致性的传感器选择方法。首先,基于信息质量相关概念,从量测自身属性和在应用中的可用性两方面描述传感器量测对目标跟踪的价值。其次,考虑到信息一致性属于量测不确定条件下传感器量测的自身属性,通过引入一致性检验算子计算各传感器目标跟踪信息之间的支持度来评价各传感器量测自身的优劣,并使用信息论指标计算各传感器目标跟踪信息的信息增益来描述量测对目标跟踪精度的贡献,结合两者设计量测不确定条件下的传感器选择目标与传感器选择模型。最后,基于多目标优化算法求解所提出的传感器选择模型,并使用含估计反馈结构的融合算法以改善滤波表现。

2.    针对数据传输随机延迟条件下的传感器选择问题,提出一种基于信息年龄的传感器选择方法。首先,考虑到信息年龄属于异步场景中传感器量测的自身属性,借助时间平均信息年龄、信息年龄截止约束和信息年龄惩罚函数三种方式分析各传感器目标跟踪信息的信息年龄,进而描述各异步传感器量测自身的优劣。其次,在信息质量框架下将信息年龄与信息论指标相结合设计异步传感器选择目标并建立对应的三种异步传感器选择模型。最后,基于多目标优化算法与贪婪算法求解所提出的三种异步传感器选择模型,并使用多传感器异步融合方法对被选传感器进行异步融合。

3.    针对分布式框架下的传感器控制问题,提出一种基于稀疏促进的分布式传感器控制方法。首先,使用拍卖式部分可观马尔可夫决策过程模型对分布式传感器控制问题进行建模,并使用基于共识的拍卖算法求解该模型。其次,考虑到分布式传感器控制中由于共享优化目标而出现的被控传感器行为重复问题,基于传感器之间的相对关系设计稀疏促进项,通过传感器邻居向量的稀疏性来描述被控传感器与其他传感器行为的相似性。同时,基于信息论指标设计观测奖励项,通过计算传感器各动作所对应目标跟踪信息的信息增益来描述不同动作对目标跟踪的影响。最后,结合两者设计分布式框架下的传感器控制目标,优化传感器探测动作以提升对目标的探测效果。

4.    针对含连续动作空间的非短视传感器控制问题,提出了一种基于追逐奖励的非短视传感器控制方法。首先,在多智能体强化学习框架下设计具有连续动作空间的多传感器目标跟踪环境模型和动平台传感器的运动学模型,并基于部分可观马尔可夫决策过程模型对非短视传感器控制问题进行建模。其次,为引导动平台传感器改善目标跟踪效果并提升强化学习训练效率,设计包含目标跟踪信息的信息增益、信息增益一致性奖励、观测范围奖励和追逐奖励在内的加权式奖励函数,其中追逐奖励描述了传感器与目标的相对关系。最后,采用集中式训练、分布式执行的架构完成对传感器控制策略的训练,并使用课程式训练方法提升训练效率。

 

1:李泽仁和蔡老师合影

2:李泽仁和老师们合影