机器人群合作的进化机器人方法

2019-08-16 15:15

重组，由于交配或结合来自不同生物的DNA片段而遗传物质的重排具有许多进化优势。例如，它允许有机体从其基因组中去除有害突变并采取更有用的突变。

洛林大学(UniversitédeLorraine)的研究员Amine Boumaza最近试图将这一过程应用于在线体现的进化机器人技术，这是一个机器人技术领域，专注于复制机器人的进化理论。在他发表在GECCO '19遗传和进化计算会议期刊上的论文中，他开发了一个受进化启发的重组操作员，并对需要多个机器人之间协作的三个任务进行了培训。

“我的研究属于更广泛的人工智能主题，更具体地说，是了解我们如何设计可以学习完成有趣任务的代理人，”Boumaza说。“这个研究课题不是新的，而是陈旧的，最近得到了很多关注，因为深度学习的结果令人印象深刻。在我的情况下，我对群体机器人更感兴趣，其目标是制作大量的小型机器人合作解决任务并适应环境变化。“

Boumaza着重于生物体更好地应对生命挑战的进化策略，特别是重组，开始研究是否可以将类似的机制应用于机器人方法。他的假设是，如果在机器人中成功复制，重组将提高其性能和效率。

“当我们谈论机器人代理时，我们通常假设一个物理实体体现在一个环境中(例如房间里的真空清洁机器人)，”Boumaza说。“这个代理人使用一组传感器(障碍物传感器，摄像机等)来感知周围环境，这可以使它具有某种环境代表性。代理人也可以使用效应器(电机，手臂，清洁刷)在环境中起作用。这些动作是计算结果，是我们通常称之为控制器的输出(即某种决策程序)。“

三个被考虑的学习环境之一，即项目收集。在项目集合中，代理必须收集尽可能多的项目(红点)。图片来源：Amine Boumaza。

控制器本质上是一种程序，它处理机器人通过其传感器获取的感知并将命令输出到其效应器。例如，在机器人真空吸尘器的情况下，控制器将处理关于其周围环境的信息，检测其前面是否有灰尘，然后产生将使机器人激活真空并推进以吸尘的输出。

“采取进一步措施，我们还可以考虑可以在同一环境中发展的多种代理商，”Boumaza说。“在这种情况下为每个代理设计控制器是一个非常困难的问题，目前还没有有效的技术。在这种情况下，我们可以有很少(例如，10到100)复杂机器人，或许多非常简单的机器人(例如，数百)以通常受昆虫行为启发的方式进行互动;这就是我们所说的群体机器人。“

在开发能够有效完成特定任务的机器人时，研究人员需要设计一个围绕特定任务量身定制的控制器。如果机器人要操作的环境很简单，那么设计这个控制器可能相当容易，但大多数情况下并非如此。

当考虑在给定环境中交互的多个机器人时，这变得更加困难，甚至是不可能的。其主要原因是人类开发人员无法预测每个机器人将遇到的所有情况，以及解决这些情况的最有效行动。幸运的是，近年来，机器学习的进步为机器人研究开辟了有趣的新可能性，允许开发人员整合能够实现持续学习的工具，实质上是训练控制器以应对随时间变化的各种情况。

“以这种方式设计控制器的一种方法是使用进化算法，松散地说，它试图模仿物种的自然进化来演化机器人代理控制器，”Boumaza说。“这是一个迭代过程，当动物更好地适应环境时，控制器会更好地完成任务。目标不是模拟自然进化，而是从中获取灵感。”

三种考虑的学习环境之一，即觅食。在觅食中，代理商必须收集物品并将它们带回巢穴(两个黑圈中的一个)。绿色的地板是一条信息素路径，增加了方向感，它高度集中在巢穴位置，而且距离较远。图片来源：Amine Boumaza。

进化机器人只是研究人员用于设计机器人控制器的众多技术之一。然而，近年来，随着越来越多的研究旨在复制动物和人类中观察到的进化策略，进化方法越来越受欢迎。

“进化机器人技术有一些优点，例如我们不需要指定如何解决任务(由算法发现/学习)，而只需要指定一种方法来衡量任务的执行情况，“布马扎说。它也有一些缺点，因为它是一个非常缓慢且计算密集的过程，在真实机器人上执行起来非常困难。此外，这些方法通常对绩效指标非常敏感，因为它们决定了代理人学到的行为。“

与该领域的其他研究人员一样，Boumaza一直在努力开发新方法来克服现有进化机器人技术的缺点。在他最近的研究中，他特别提出使用一种受重组启发的新“交配操作员”，这可以提高机器人模拟的收敛速度。这是一项了不起的成就，因为它最终可以减少将模拟方法转移到真实机器人所需的时间。

他将重组操作员应用于三个集体机器人任务：运动，物品收集和物品觅食。然后，他将使用其算法的纯粹变异版本与不同重组算子的性能进行了比较。在他的实验中收集的结果表明，在正确设计时，重组策略实际上可以改善一群机器人在他考虑的所有任务中的适应性。

在未来，他提出的新的进化机器人方法可用于增强机器人在需要多个代理之间协作的任务中的性能和适应性。然而，与此同时，Boumaza计划在新任务上测试他的算法，以确定他在他关注的三个任务中观察到的改进是否仍然成立。

“检查我的方法是否可以在真正的机器人上实施也很有趣，”Boumaza说。“理论上没有任何阻止，除了拥有大量物理机器人并接受处理'现实差距'(即我们在模拟中看到的通常不是现实中会发生的事情，因为模拟简化。群体机器人是全部关于数字和单个机器人的故障不应该妨碍群体。因此，最终，为了确定这种方法的有效性，它必须在物理机器人中进行实际测试。