Conférence de Sébastien Bubeck organisée par le département d’informatique.
I will present three new results : (i) the Cramer transform of the uniform measure on a convex body is a universal self-concordant barrier ; (ii) projected gradient descent with Gaussian noise allows to sample from a log-concave measure in polynomial time ; and (iii) Thompson sampling combined with a multi-scale exploration solves the Bayesian convex bandit problem. The unifying theme in these results is the interplay between concepts from convex geometry, learning and information theory. No background in optimization will be assumed.
Voir aussi
|
Cursus :
Sébastien Bubeck est chercheur pour le groupe de recherches Microsoft. En 2011, il a obtenu le prix Jacques Neveu qui récompense sa thèse « Jeux de bandits et fondations du clustering » (co-encadrée par Rémi Munos de l’équipe de recherche Inria SEQUEL et Cristina Butucea professeure au Laboratoire Paul Painlevé de l'Université de Lille 1).
Ce prix récompense une thèse en probabilités ou statistiques.
Cliquer ICI pour fermerDernière mise à jour : 21/07/2016