Apprentissage avec des experts
- Supposons n experts, E1,....En, qui investissent à la bourse.
- chaque expert à une stratégie: à l'instant t, acheter x et vendre y.
- Il en résulte un Gain(i,t) de l'expert i à l'instant t.
- Peut-on suivre une stratégie dont le gain est proche du gain du meilleur expert?
- Quelle stratégie adopter?
- Ce problème a une solution simple!! Méthode des poids multiplicatifs
- Construire une distribution à chaque instant, définie par le gain wi de chaque expert i, qui est la somme des gains aux instants précédents.
- Tirer l'expert i avec probabilité ewi/ Sum ewi .
- De manière équivalente on peut multiplier les gains à chaque instant et tirer proportionnellement aux gains.
- L'analyse de cet algorithme montre que l'espérance du gain est une fraction constante du gain du meilleur expert.