Factorisation archétypale en matrices non-négatives avec données manquantes

Abstract : L'analyse archétypale (AA), ou factorisation convexe en matrices non-négatives (CNMF), est une variante de la factorisation en matrices non-négatives (NMF), dans laquelle les composantes obtenues sont exprimées comme une combinaison convexe d'exemples appelés archétypes. Dans cette contribution, nous proposons d'étendre AA/CNMF au cas où la matrice des données et la matrice des archétypes sont partiellement observées. Après avoir reformulé le problème dans ce contexte de données manquantes, nous proposons un algorithme de type Majorisation-Minimisation pour l'estimation des facteurs de la décomposition puis la reconstruction des données manquantes. Une comparaison est réalisée sur des données synthétiques, mettant en évidence une amélioration des performances de reconstruction de données manquantes par rapport à la NMF classique. L'écart de performance se révèle particulièrement intéressant lorsque le bruit est important ou que le nombre de données manquantes est grand.
Complete list of metadatas

https://hal-amu.archives-ouvertes.fr/hal-01334618
Contributor : Valentin Emiya <>
Submitted on : Tuesday, June 21, 2016 - 9:57:08 AM
Last modification on : Thursday, June 27, 2019 - 4:27:50 PM

Identifiers

  • HAL Id : hal-01334618, version 1

Citation

Ronan Hamon, Valentin Emiya, Cédric Févotte. Factorisation archétypale en matrices non-négatives avec données manquantes. Conférence francophone sur l'apprentissage automatique (CAp), Jul 2016, Marseille, France. ⟨hal-01334618⟩

Share

Metrics

Record views

630