Réseaux récurrents et comportement cognitifs minimalistes
Dans un article publié en 1996[1], Randall Beer décrit une série d’expériences simulées sur ordinateur, dans lesquelles des agents apprennent à poursuivre des cibles mobiles, avec des contraintes de plus en plus élevées. Les premières expériences sont simples et ne nécessitent qu’une forme réflexe d’intelligence (stimulus/action), mais progressivement les contraintes obligent les agents à adopter des comportements cognitifs minimalistes.
Par exemple il s’agira d’attraper un objet, mais dès que l’agent se déplace, il ne perçoit plus rien, il devient aveugle. Il est donc obligé d’observer la trajectoire de l’objet dans un premier temps, puis de prendre une décision, en se déplaçant. La résolution de ces tâches se font grâce à des réseaux de neurones récurrents (RNNs), optimisés à l’aide d’algorithmes génétiques.
Pour faire tourner la première expérience, dans votre navigateur, cliquez ici. Le comportement qui est obtenu n’est pas extraordinaire (il s’agit d’un comportement réflexe), mais il permet d’illustrer le principe des algorithmes génétiques, ainsi que certaines caractéristiques des RNNs. Les comportement suivants, plus complexes, feront l’objet de futurs billets.
- [1] « Toward the Evolution of Dynamical Neural Networks for Minimally Cognitive Behavior » Randall Beer, 1996
- [2] https://www.sikorama.fr/resources/beer-rnn/