Outils logiciels pour les cours Paris II

Cours Paris II

Stages/ Thèses/ Séminaires

Laboratoire

edit SideBar

B D10a

Apprentissage avec des experts

  • Supposons n experts, E1,....En, qui investissent à la bourse.
    • chaque expert à une stratégie: à l'instant t, acheter x et vendre y.
    • Il en résulte un Gain(i,t) de l'expert i à l'instant t.
  • Peut-on suivre une stratégie dont le gain est proche du gain du meilleur expert?
  • Quelle stratégie adopter?
  • Ce problème a une solution simple!! Méthode des poids multiplicatifs
    • Construire une distribution à chaque instant, définie par le gain wi de chaque expert i, qui est la somme des gains aux instants précédents.
    • Tirer l'expert i avec probabilité ewi/ Sum ewi .
  • De manière équivalente on peut multiplier les gains à chaque instant et tirer proportionnellement aux gains.
  • L'analyse de cet algorithme montre que l'espérance du gain est une fraction constante du gain du meilleur expert.
UP2