Dans cette vidéo, les auteurs ont observé des agents qui apprenaient progressivement à utiliser des outils de plus en plus complexes en jouant à un simple jeu de cache-cache. En s'entraînant dans un nouvel environnement de simulation de cache-cache, les agents ont développé une série de six stratégies et contre-stratégies distinctes, dont certaines étaient inconnues jusqu'alors. La complexité émergente auto-supervisée dans cet environnement simple suggère que la co-adaptation multi-agent pourrait un jour produire des comportements extrêmement complexes et intelligents.
OUIC
Fondateur
0
0
créé le : 13/04/2023
mis à jour le : 14/12/2025
Trop intéressant !
Fataaa
Premium
0
0
créé le : 14/04/2023
mis à jour le : 14/04/2023
une autre IA qui joue à débloquer des situations :
Deviaweb est soucieux de l'importance de vos données personnelles.
Votre vie privée et votre confort de navigation sont nos priorités.
Nous n'utilisons donc aucun cookie.