Raffiner l'heuristique CHS à l'aide de bandits - Aix-Marseille Université Accéder directement au contenu
Communication Dans Un Congrès Année : 2021

Raffiner l'heuristique CHS à l'aide de bandits

Mohamed Sami Cherif
  • Fonction : Auteur
  • PersonId : 1290539
  • IdHAL : sami-cherif
Djamal Habet
  • Fonction : Auteur
  • PersonId : 940715
Cyril Terrioux

Résumé

Récemment, une heuristique efficace, appelée Conflict History Search (CHS), a été introduite pour la résolution du problème de satisfaction de contraintes (CSP). Elle repose sur une technique d'apprentissage par renforcement appelée Exponential Recency Weighted Average (ERWA) pour estimer la dureté des contraintes. CHS favorise les variables qui apparaissent souvent dans les échecs récents. Le paramètre de pas utilisé dans CHS est important car il contrôle l'estimation de la dureté des contraintes. Dans cet article, nous envisageons un raffinement de ce paramètre à l'aide d'un bandit manchot. Le bandit sélectionne une valeur appropriée de ce paramètre lors des redémarrages effectués par l'algorithme de recherche. Chaque bras correspond à l'heuristique CHS avec une valeur donnée pour le paramètre de pas et est récompensé selon sa capacité à mener une recherche efficace. Une phase d'entraînement est introduite en amont de la recherche pour aider le bandit à choisir un bras pertinent. L'évaluation expérimentale montre que cette approche conduit à des améliorations significatives.
Fichier principal
Vignette du fichier
jfpc2021c.pdf (532.39 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03270911 , version 1 (25-06-2021)

Identifiants

  • HAL Id : hal-03270911 , version 1

Citer

Mohamed Sami Cherif, Djamal Habet, Cyril Terrioux. Raffiner l'heuristique CHS à l'aide de bandits. Actes des 16èmes Journées Francophones de Programmation par Contraintes (JFPC), Jun 2021, Nice, France. ⟨hal-03270911⟩
95 Consultations
28 Téléchargements

Partager

Gmail Facebook X LinkedIn More