北京信息科技大学学报(自然科学版)

2023, v.38;No.156(06) 1-10

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

基于联邦深度强化学习的多无人机轨迹规划算法
A multi-UAVs trajectory planning algorithm based on federated deep reinforcement learning

王鉴威,李学华,陈硕

摘要(Abstract):

针对多无人机协同服务地面用户移动边缘计算服务,构建以多无人机服务地面用户公平性和计算时延加权和最大化为目标的模型,联合优化无人机轨迹和任务卸载比例的调度。提出了一种移动边缘计算场景下基于联邦深度强化学习的多无人机轨迹规划算法。该算法首先在各无人机上部署独立的深度强化学习模型,使每架无人机根据自身获取的信息进行学习获取局部最优模型。其次引入联邦学习框架,通过信息聚合的方式,使多无人机协同服务地面用户,让服务效果达到全局最优。仿真结果表明,与无信息交互的多智能体深度强化学习相比,提出的方案有效优化了公平性和时延。

关键词(KeyWords): 无人机通信;移动边缘计算;深度强化学习;联邦学习;轨迹规划;公平性

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金项目(61901043);; 北京信息科技大学“勤信人才”培育计划(QXTCPB202101);; 北京市教委科研计划科技一般项目(KM202211232010)

作者(Author): 王鉴威,李学华,陈硕

DOI: 10.16508/j.cnki.11-5866/n.2023.06.001

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享