L’identification des besoins latents de formation à l’aide de grands ensembles de données ‒ CHILI ‐ EPFL

C’est un fait bien connu que de nombreuses professions, surtout de nos jours, subissent des changements qui modifient les compétences qui leur sont nécessaires. Avec le rythme rapide de l’automatisation et de la numérisation au cours des dernières années, ces changements sont devenus de plus en plus rapides dans de nombreuses industries (p. ex. développement de logiciels, fabrication), à divers degrés. Traditionnellement, la tâche d’identification des compétences manquantes au sein d’une main-d’œuvre afin d’y remédier est appelée Analyse des besoins de formation et repose sur des questionnaires et des évaluations de performance à différents niveaux d’une organisation ou d’une industrie, dont les résultats sont ensuite agrégés. Cependant, ce processus est coûteux et prend beaucoup de temps, et lorsque les “nouvelles compétences” sont identifiées, elles sont peut-être déjà obsolètes. Notre objectif dans ce projet est d’utiliser de grands ensembles de données continuellement mis à jour pour comprendre le processus par lequel de nouvelles compétences se profilent à l’horizon dans une industrie, et d’être en mesure de les prévoir à l’avance, accélérant ainsi leur identification comme compétences importantes qui seront nécessaires pour la main-d’œuvre. Actuellement, nous nous concentrons sur l’industrie du logiciel, avec Google Trends, Stack Overflow, les offres d’emploi et les MOOCs comme sources de données, en essayant de répondre à des questions telles que l’interaction entre les plates-formes Q&A, les offres d’emploi et les cours en ligne, et les signaux dans chaque source de données qui pourraient nous permettre de prévoir l’émergence – ou non – d’une nouvelle compétence.