Raffiner l'heuristique CHS à l'aide de bandits - Aix-Marseille Université Access content directly
Conference Papers Year :

Raffiner l'heuristique CHS à l'aide de bandits

Mohamed Sami Cherif
  • Function : Author
  • PersonId : 1090439
Djamal Habet
  • Function : Author
  • PersonId : 940715
Cyril Terrioux

Abstract

Récemment, une heuristique efficace, appelée Conflict History Search (CHS), a été introduite pour la résolution du problème de satisfaction de contraintes (CSP). Elle repose sur une technique d'apprentissage par renforcement appelée Exponential Recency Weighted Average (ERWA) pour estimer la dureté des contraintes. CHS favorise les variables qui apparaissent souvent dans les échecs récents. Le paramètre de pas utilisé dans CHS est important car il contrôle l'estimation de la dureté des contraintes. Dans cet article, nous envisageons un raffinement de ce paramètre à l'aide d'un bandit manchot. Le bandit sélectionne une valeur appropriée de ce paramètre lors des redémarrages effectués par l'algorithme de recherche. Chaque bras correspond à l'heuristique CHS avec une valeur donnée pour le paramètre de pas et est récompensé selon sa capacité à mener une recherche efficace. Une phase d'entraînement est introduite en amont de la recherche pour aider le bandit à choisir un bras pertinent. L'évaluation expérimentale montre que cette approche conduit à des améliorations significatives.
Fichier principal
Vignette du fichier
jfpc2021c.pdf (532.39 Ko) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-03270911 , version 1 (25-06-2021)

Identifiers

  • HAL Id : hal-03270911 , version 1

Cite

Mohamed Sami Cherif, Djamal Habet, Cyril Terrioux. Raffiner l'heuristique CHS à l'aide de bandits. Actes des 16èmes Journées Francophones de Programmation par Contraintes (JFPC), Jun 2021, Nice, France. ⟨hal-03270911⟩
90 View
17 Download

Share

Gmail Facebook Twitter LinkedIn More