Raffiner l'heuristique CHS à l'aide de bandits

Mohamed Sami Cherif; Djamal Habet; Cyril Terrioux

Communication Dans Un Congrès Année : 2021

Raffiner l'heuristique CHS à l'aide de bandits

(1) , (1) , (1)

Mohamed Sami Cherif

Fonction : Auteur
PersonId : 1290539
IdHAL : sami-cherif

COntraintes, ALgorithmes et Applications

Djamal Habet

Fonction : Auteur
PersonId : 940715

COntraintes, ALgorithmes et Applications

Cyril Terrioux

Fonction : Auteur
PersonId : 176108
IdHAL : cyril-terrioux
IdRef : 07561166X

COntraintes, ALgorithmes et Applications

Résumé

Récemment, une heuristique efficace, appelée Conflict History Search (CHS), a été introduite pour la résolution du problème de satisfaction de contraintes (CSP). Elle repose sur une technique d'apprentissage par renforcement appelée Exponential Recency Weighted Average (ERWA) pour estimer la dureté des contraintes. CHS favorise les variables qui apparaissent souvent dans les échecs récents. Le paramètre de pas utilisé dans CHS est important car il contrôle l'estimation de la dureté des contraintes. Dans cet article, nous envisageons un raffinement de ce paramètre à l'aide d'un bandit manchot. Le bandit sélectionne une valeur appropriée de ce paramètre lors des redémarrages effectués par l'algorithme de recherche. Chaque bras correspond à l'heuristique CHS avec une valeur donnée pour le paramètre de pas et est récompensé selon sa capacité à mener une recherche efficace. Une phase d'entraînement est introduite en amont de la recherche pour aider le bandit à choisir un bras pertinent. L'évaluation expérimentale montre que cette approche conduit à des améliorations significatives.

Domaines

Intelligence artificielle [cs.AI]

Fichier principal

jfpc2021c.pdf (532.39 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Cyril Terrioux : Connectez-vous pour contacter le contributeur

https://amu.hal.science/hal-03270911

Soumis le : vendredi 25 juin 2021-11:12:03

Dernière modification le : vendredi 22 mars 2024-18:24:04

Archivage à long terme le : dimanche 26 septembre 2021-21:07:07

Dates et versions

hal-03270911 , version 1 (25-06-2021)

Identifiants

HAL Id : hal-03270911 , version 1

Citer

Mohamed Sami Cherif, Djamal Habet, Cyril Terrioux. Raffiner l'heuristique CHS à l'aide de bandits. Actes des 16èmes Journées Francophones de Programmation par Contraintes (JFPC), Jun 2021, Nice, France. ⟨hal-03270911⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-TLN CNRS UNIV-AMU LIS-LAB ANR INCIAM

95 Consultations

28 Téléchargements

Raffiner l'heuristique CHS à l'aide de bandits

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager