Skip to Main content Skip to Navigation
Habilitation à diriger des recherches

DES RESEAUX DE NEURONES ARTIFICIELS A LA ROBOTIQUE COOPERATIVE

Abstract : Les travaux décrits dans ce mémoire rapportent une trajectoire scientifique d’une dizaine d’années constamment guidée par le désir d’étudier et de développer des modèles de réseaux de neurones artificiels en prise directe avec le monde réel. La première partie de nos recherches s’est intéressée à l’apprentissage au sein de systèmes connexionnistes multi-réseaux. En droite ligne depuis le modèle de la Machine Séquentielle Connexionniste (MSC, développée durant la thèse de doctorat), qui met en jeu 2 réseaux multicouches, 6 MSCs sont mises en oeuvre qui permettent l’acquisition et le contrôle de la marche chez un robot hexapode. Le paradigme utilisé pour la distribution des informations nécessaires à chacun des modules connexionnistes est l’apprentissage par pénalité-récompense. Un robot hexapode a été construit qui valide les résulats préalablement obtenus en simulation. L’apprentissage par pénalité-récompense appartient à la classe des apprentissage par renforcement. La seconde partie de nos recherches s’est intéressée à étudier les interactions entre les réseaux de neurones artificiels et l’apprentissage par renforcement. Une implantation sur réseaux multicouches, puis sur cartes auto-organisatrices du Q-learning a été proposée. Nous obtenons ainsi des réductions de la taille mémoire requise et du nombre d’itérations d’apprentissage nécessaires qui autorisent une utilisation pratique. Nous avons ensuite développé des mécanismes de distribution de l’apprentissage par renforcement, soit au sein d’un seul robot doté de plusieurs comportements, soit au sein d’un groupe de robots dans une tâche impliquant la coopération. A la différence des courant de recherches actuels, qui pronent l’utilisation d’ a priori face à la combinatoire élevée de l’espace de recherche, nous proposons l’emploi d’ a posteriori , l’utilisation du “lazy learning” pour construire un modèle non explicite et le développement d’outils et méthodes d’aide à la conception des fonctions de renforcement. A moyen terme, l’objectif de nos recherches est d’automatiser la décomposition d’un comportement robotique complexe en une succession de comportements élémentaires. L’utilisation de marqueurs temporel et spatial est envisagée pour permettre le séquencement des cartes auto-organisatrices implantant les comportements élémentaires. Dans ce cas, la simple définition de l’objectif à atteindre suffirait alors à générer le comportement solution.
Complete list of metadatas

Cited literature [36 references]  Display  Hide  Download

https://hal-amu.archives-ouvertes.fr/tel-01338022
Contributor : Claude Touzet <>
Submitted on : Monday, June 27, 2016 - 4:54:15 PM
Last modification on : Monday, January 29, 2018 - 4:48:05 PM

Identifiers

  • HAL Id : tel-01338022, version 1

Collections

Citation

Claude Touzet. DES RESEAUX DE NEURONES ARTIFICIELS A LA ROBOTIQUE COOPERATIVE. Intelligence artificielle [cs.AI]. Aix Marseille Université, 1998. ⟨tel-01338022⟩

Share

Metrics

Record views

514

Files downloads

2622