摘 要:鉴于采用深度强化学习算法进行移动机器人路径规划时存在收敛速度慢的问题,提出一种改进的算法。对经验回放机制中样本的学习潜力得分进行设计,根据学习潜力得分对样本进行优先级评分,并根据评分进行采(试读)...