深度强化运动学习中的协同作用出现?
人类的运动控制非常有效,自然而高效地完成复杂的动作,而不需要花费太多的精力。这是因为运动在中枢神经系统中的协同作用。运动协同使中枢神经系统能够使用较小的变量集来控制一大群肌肉。从而简化协调的复杂运动的控制。
现在,东北大学的研究人员使用深度强化学习算法在机器人代理中观察到了类似的概念。
DRL使机器人代理能够在其虚拟环境中学习最佳操作。它可以解决复杂的机器人任务,同时最大限度地减少人工操作,实现最佳性能。另一方面,经典算法需要人工干预才能为每个新任务找到具体的解决方案。
然而,将人与人开发者_如何学编程之间的运动协同应用于机器人世界并不容易。尽管许多研究支持在人类和动物运动控制中使用运动协同,但背景过程仍然未知。
在目前的研究中,东北大学的研究人员在行走机器人代理上使用了两种DRL算法,它们被称为半猎豹和全猎豹。这两种算法分别是TD3和SAC。
这两个机器人代理的任务是在给定的时间内尽可能地向前跑。机器人代理总共完成了300万步。DRL没有使用协同信息,但是机器人代理已经证明了在锻炼中协同的出现。
东北大学教授、该研究的合著者林光宏指出:我们首次以定量的方式证实,即使在深度学习中,运动协同也可以像人类一样出现。Hayashibe教授补充道:经过深度学习,机器人智能体利用电机协同作用,提高了电机性能,限制了能耗。
展望未来,研究人员旨在用不同的身体模型探索更多的任务,以进一步证实他们的发现。
精彩评论