DES RESEAUX DE NEURONES ARTIFICIELS A LA ROBOTIQUE COOPERATIVE

Claude Touzet

Hdr Année : 1998

DES RESEAUX DE NEURONES ARTIFICIELS A LA ROBOTIQUE COOPERATIVE

(1)

Claude Touzet

Fonction : Auteur
PersonId : 9191
IdHAL : claude-touzet
IdRef : 031952259

Laboratoire de Neurosciences intégratives et adaptatives

Résumé

Les travaux décrits dans ce mémoire rapportent une trajectoire scientifique d’une dizaine d’années constamment guidée par le désir d’étudier et de développer des modèles de réseaux de neurones artificiels en prise directe avec le monde réel. La première partie de nos recherches s’est intéressée à l’apprentissage au sein de systèmes connexionnistes multi-réseaux. En droite ligne depuis le modèle de la Machine Séquentielle Connexionniste (MSC, développée durant la thèse de doctorat), qui met en jeu 2 réseaux multicouches, 6 MSCs sont mises en oeuvre qui permettent l’acquisition et le contrôle de la marche chez un robot hexapode. Le paradigme utilisé pour la distribution des informations nécessaires à chacun des modules connexionnistes est l’apprentissage par pénalité-récompense. Un robot hexapode a été construit qui valide les résulats préalablement obtenus en simulation. L’apprentissage par pénalité-récompense appartient à la classe des apprentissage par renforcement. La seconde partie de nos recherches s’est intéressée à étudier les interactions entre les réseaux de neurones artificiels et l’apprentissage par renforcement. Une implantation sur réseaux multicouches, puis sur cartes auto-organisatrices du Q-learning a été proposée. Nous obtenons ainsi des réductions de la taille mémoire requise et du nombre d’itérations d’apprentissage nécessaires qui autorisent une utilisation pratique. Nous avons ensuite développé des mécanismes de distribution de l’apprentissage par renforcement, soit au sein d’un seul robot doté de plusieurs comportements, soit au sein d’un groupe de robots dans une tâche impliquant la coopération. A la différence des courant de recherches actuels, qui pronent l’utilisation d’ a priori face à la combinatoire élevée de l’espace de recherche, nous proposons l’emploi d’ a posteriori , l’utilisation du “lazy learning” pour construire un modèle non explicite et le développement d’outils et méthodes d’aide à la conception des fonctions de renforcement. A moyen terme, l’objectif de nos recherches est d’automatiser la décomposition d’un comportement robotique complexe en une succession de comportements élémentaires. L’utilisation de marqueurs temporel et spatial est envisagée pour permettre le séquencement des cartes auto-organisatrices implantant les comportements élémentaires. Dans ce cas, la simple définition de l’objectif à atteindre suffirait alors à générer le comportement solution.

Mots clés

Q-learning “Behavior based” robotique

Réseaux de neurones artificiels Connexionnisme Systèmes multi-réseaux Apprentissage par renforcement Robotique coopérative

Domaines

Intelligence artificielle [cs.AI] Réseau de neurones [cs.NE] Robotique [cs.RO]

Fichier principal

HDR-Touzet.pdf (343.69 Ko)

Claude Touzet : Connectez-vous pour contacter le contributeur

https://amu.hal.science/tel-01338022

Soumis le : lundi 27 juin 2016-16:54:15

Dernière modification le : vendredi 24 mars 2023-14:53:02

Dates et versions

tel-01338022 , version 1 (27-06-2016)

Identifiants

HAL Id : tel-01338022 , version 1

Citer

Claude Touzet. DES RESEAUX DE NEURONES ARTIFICIELS A LA ROBOTIQUE COOPERATIVE. Intelligence artificielle [cs.AI]. Aix Marseille Université, 1998. ⟨tel-01338022⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS UNIV-AMU LNIA

456 Consultations

2387 Téléchargements

DES RESEAUX DE NEURONES ARTIFICIELS A LA ROBOTIQUE COOPERATIVE

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager