CIS – Colloquium J-P Vert

Classements et tris différenciés
(Differentiable ranking and sorting)

 22 juin 2020 – 3:15 pm (UTC/GMT +02:00) 
Zoom Webinar

Le professeur Jean-Philippe Vert est un chercheur qui s’intéresse à l’apprentissage machine et à la biologie computationnelle, travaillant en tant que :

  • Chercheur senior chez Google Brain à Paris
  • Professeur de recherche au Centre de biologie computationnelle de Mines ParisTech.

Le tri et le classement d’un tableau sont des routines fondamentales de l’apprentissage machine, utilisées pour calculer des statistiques basées sur le classement, des fonctions de distribution cumulative (CDF), des quantiles, ou pour sélectionner les voisins les plus proches et les étiquettes.

Les fonctions de tri et de classement sont cependant constantes par morceaux (la permutation de tri d’un vecteur ne change pas si les entrées de ce vecteur sont perturbées de manière infinitésimale) et ne disposent donc pas d’informations de gradient à rétro-prograder.

Dans cet entretien, Prof. Vert abord différentes approches pour concevoir des opérateurs de tri et de classement différenciables, en utilisant des techniques de régularisation ou de perturbation, et il met en évidence certaines applications dans l’apprentissage du classement ou la factorisation matricielle.

Jean-Philippe Vert est chercheur chez Google Brain à Paris et chercheur associé à PSL Mines ParisTech depuis 2018.

Il est diplômé de l’Ecole Polytechnique (1995) et du Corps des Mines (1998), et est titulaire d’un MS et d’un doctorat en mathématiques de l’Université Paris 6 préparés à l’Ecole normale supérieure de Paris (2001). Après un postdoc en biologie computationnelle à l’université de Kyoto, il a rejoint l’Ecole des Mines de Paris (MINES ParisTech) en tant que chercheur en 2003.

Il y a été le directeur fondateur du Centre de biologie computationnelle de 2006 à 2018, chef d’équipe à l’Institut Curie sur la biologie computationnelle du cancer (2008-2018), chercheur invité à l’Université de Berkeley (2015-2016), et professeur au département de mathématiques de l’Ecole normale supérieure de Paris (2016-2018).

Ses recherches portent sur le développement de méthodes statistiques et d’apprentissage automatique, en particulier pour modéliser des données complexes, à haute dimension et structurées, avec une application axée sur la biologie computationnelle, la génomique et la médecine de précision. Ses récentes contributions comprennent de nouvelles méthodes pour intégrer des données structurées telles que des chaînes de caractères, des graphiques ou des permutations dans des espaces vectoriels, des techniques de régularisation pour apprendre à partir de quantités limitées de données, et des techniques informatiques efficaces pour la détection de modèles et la sélection de caractéristiques.

Il travaille également sur plusieurs applications médicales dans le domaine de la recherche sur le cancer, notamment la quantification et la modélisation de l’hétérogénéité du cancer, la prédiction de la réponse à la thérapie et la modélisation du génome et de l’épigénome des cellules cancéreuses au niveau d’une seule cellule.