Les données en contexte : Critical Data Studies

"Crowd". Image publiée par James Cridland le 23 juin 2007 sur le site Flickr. URL : https://www.flickr.com/photos/jamescridland/613445810

Présentation

Le cours « Critical Data Studies » s’inscrit dans la nouvelle offre d’enseignements UNIL/EPFL qui propose de croiser des savoirs provenant des SHS et des sciences de l’ingénieur afin d’aborder des thématiques complexes qui nécessitent une méthodologie interdisciplinaire.

Ce cours permettra aux étudiants des deux campus d’apprendre à maîtriser les outils informatiques actuels dans le domaine des Data Sciences pour les employer sur des jeux de données provenant des sciences humaines et sociales. Les méthodes d’analyse quantitatives de données seront présentées et mises en perspective de manière critique à partir de méthodologies et de travaux provenant de différentes disciplines des SHS (anthropologie, philosophie, sociologie).

Enseignants

  • Christine Choirat
  • Charlotte Mazel-Cabasse

Assistant-étudiant à contacter en cas de question(s)

Une donnée n’est jamais neutre. Elle s’inscrit toujours dans un « assemblage de données » qui dépend d’une multitude de facteurs contextuels, d’agents humains, d’institutions, ou encore de déterminations techniques. Et pourtant, les données, aujourd’hui traitées massivement dans le domaine social, culturel, autant que dans celui de la recherche, sont souvent perçues comme des entités objectives, permettant de limiter les biais de l’interprétation subjective. Cela dit, les débats contemporains autour de la reconnaissance faciale ou de l’intelligence artificielle nous montrent que les données massives peuvent elles-mêmes produire des résultats problématiques, qui dépendent souvent de leur usage en société et des intentions des acteurs qui les emploient, les étudient, ou les commercialisent. Dès lors, quels sont les a priori à partir desquels nous tirons des informations et construisons des savoirs à partir de jeux de données ? Comment comprendre cette notion englobante qui qualifie aujourd’hui des informations provenant de l’astrophysique, d’interactions sociales, autant que de sources textuelles ? 

Le cours UNIL/EPFL « Critical Data Studies » s’attache à mettre en lumière les défis méthodologiques autant que l’ensemble des biais qui peuvent découler de l’étude de données considérées, a priori, comme « objectives » et naturelles.

Durant la première partie du semestre, les étudiants se familiarisent avec un écosystème numérique permettant le traitement, l’analyse et le partage de données massives (environnement Renku) tout en découvrant les travaux issus du champ contemporain des « critical data studies » qui portent sur « les défis culturels, éthiques et critiques que posent les données massives » (Iliadis et Russo 2016).

Le cours, organisé autour de projets interdisciplinaires, proposera de retracer la chaîne des données telle qu’elle apparaît dans les dispositifs numériques contemporains (acquisition, transformation, modélisation, visualisation, etc.), afin de questionner chacune de ces étapes à partir d’outils critiques et réflexifs. Qu’est-ce que le traitement quantitatif fait aux données ? Comment sont-elles transformées lors de leur collecte ? Comment concilier la prise en compte du contexte et le traitement automatisé de larges ensembles de données ? A partir de quels présupposés leur donne-t-on du sens ? Quelle est l’histoire de la notion de « données » ?

"Hunger Games Control Room". Capture d'écran du film "Hunger Games" (Gary Ross, 2012) prise sur Pinterest. URL : https://www.pinterest.com/pin/369717450631340043/

"Hunger Games Control Room". Capture d'écran du film "Hunger Games" (Gary Ross, 2012) prise sur Pinterest. URL : https://www.pinterest.com/pin/369717450631340043/

Introduction

  • Qu’est-ce qu’une donnée ? Quelle est l’histoire du terme dans le domaine des SHS ?
  • Présentation de la plateforme Renku et de son écosystème. 

Le cycle de vie des données

  • Acquisition
  • Nettoyage
  • Transformation
  • Modélisation
  • Analyse
  • Visualisation.

Chaque étape du cycle de vie des données fera l’objet de deux séances qui présenteront les défis techniques et méthodologiques qu’elles posent, tout en les illustrant à partir d’exemples concrets. L’heure d’atelier qui conclura chaque séance sera dédiée à des exercices de mise en pratique des enjeux discutés durant le cours, à partir d’exercices individuels ou en groupe sur des jeux de données fournis par l’équipe pédagogique. 

Ce cours vous permettra d’acquérir les bases techniques pour conduire et documenter une recherche à partir d’un jeu de données, en prenant en compte les enjeux éthiques, politiques et méthodologiques relatifs.

  • Inscrire l’analyse de données dans une perspective historique et critique
  • Acquérir des outils techniques de pointe pour l’analyse de données
  • Se familiariser avec la structure d’une pipeline de données
  • Apprendre à identifier les enjeux théoriques/méthodologiques de chacune des étapes du cycle de vie des données.

Le premier semestre sera dédié à la présentation du contenu du cours lors de séances plénières. Les considérations théoriques issues du domaine des « critical data studies » seront présentées en parallèle des outils de traitement de données. Les étudiants forment des groupes dans le courant du premier semestre pour ensuite sélectionner un jeu de données qui fera l’objet de leur projet durant le deuxième semestre. La plupart des séances du premier semestre seront données par les membres de l’équipe pédagogique, à l’exception de quelques séances assurées par des conférenciers invités. 

Durant le premier semestre, la dernière heure de cours prendra la forme d’ateliers participatifs, autour de lecture ou d’exercices concrets d’analyse de data sets.

Le deuxième semestre sera dédié à la réalisation de projets interdisciplinaires menés par les groupes mixtes d’étudiants (UNIL/EPFL). A l’exception de la première semaine du semestre et de trois séances « milestone », le travail sur le projet s’effectuera hors-classe. Chaque équipe sera accompagnée par un superviseur qui se tiendra à leur disposition pour répondre à leurs questions et les guider dans leur travail. 

L’évaluation du cours porte sur les éléments suivants :

  • Test écrit sur le contenu du cours durant le premier semestre (mid-term) : 25%
  • Présentation en groupe du dataset et de la problématique du projet (fin du premier semestre) : 25%
  • Soumission d’un « data acquisition plan » en début de deuxième semestre : 10%
  • Note finale du projet de groupe (deuxième semestre) : 40%.

Pour les étudiant.e.s EPFL, ce cours est disponible dans le programme SHS.

Pour les étudiant.e.s UNIL, le cours est disponible dans les programmes suivants :

  • Maîtrise universitaire en humanités numériques (2016 ->) ›› Enjeux sociaux et politiques du numérique – MA-INTERFAC-CSHN-4020 – Cours optionnel à 3 ECTS
  • Maîtrise universitaire, Programme de renforcement (2015 ->) ›› Enseignements SHS – MA-RENF-SHS – Cours optionnel à 3 ECTS
  • Maîtrise universitaire ès Sciences en psychologie, pour les cinq orientations proposées (psychologie clinique ; psychologie de l’enfant et de l’adolescent ; psychologie de la santé ; psychologie du conseil et de l’orientation ; psychologie sociale et interculturelle) dans le module d’enseignements complémentaires – Cours optionnel à 3 ECTS
  • Le cours est également ouvert aux étudiants de la Maîtrise universitaire en Science politique dans l’offre de cours en choix libres.

Concernant les dernières mesures sanitaires en vigueur, merci de vous référer à la page Moodle du cours.