BIG DATA dans la classe : que faire avec ?

WORK IN PROGRESS

Travail sur l'origine des données.

Il s’agit de prendre conscience des sources de production des données : objets connectés, capteurs, numérisation, Cloud, ouverture des données, format des données…mais aussi discussions sur des forums, commentaires, tags, tweets, likes, etc. Cela invite à toute une réflexion critique sur le processus de collecte et d’élaboration des bases brutes de données (nouvelles techniques d’extraction d’information, data mining).

Pour les élèves de SES, on a des questionnements traditionnels sur la qualité des données, la qualité et les processus de récolte, les arrangements que l’on prend avec la réalité pour produire des données « présentables ». Dominique Cardon parle des « signaux et des traces ».

Quelques idées d'activités sur l'origine des données

Travail sur le traitement des données.

Le BIG DATA conduit à un renouvellement assez profond des logiques statistiques, qui signe selon certains la « fin des théories » (Chris Anderson), et une entrée en force des algorithmes. Il ne serait ainsi plus nécessaire de travailler sur des échantillons issus d’enquêtes.

La collecte massive de données donnerait accès à un ensemble de données proche de l’exhaustivité, qui permettrait de faire émerger automatiquement des corrélations, et points communs. Les données sont travaillées aujourd’hui avec des calculs massifs automatisés, appliquant des algorithmes (suite d’instructions). Pour les élèves de SES, on a des questionnements traditionnels sur la différence entre causalité et corrélation d’une part, et sur la puissance des déterminations sociales d’autre part, dans un monde numérique aux forts risques d’enfermements (la bulle numérique de ses propres préférences).

Des sociologues s’interrogent à juste titre sur la disparition des grandes catégories sociologiques posées par Durkheim, et son remplacement par la figure de l’individu « monade ».

Quelques idées d'activités sur le traitement des données

Travail sur l'utilisation et de la diffusion des données

Il s’agit ici de s’interroger sur les applications concrètes et pratiques des approches BIG DATA (systèmes experts, profilages, data-visualisation et omniprésence des infographies, data-journalisme…) qui posent des questions classiques en SES sur l’autonomie des individus, la liberté politique, les manipulations et les incitations diverses (cette « Société des calculs » si particulière dont parle Dominique Cardon, op. cit.).

Bien entendu, cette troisième étape reste étroitement reliée à la seconde étape car le traitement des données s’organise en fonction d’objectifs, et parce que la rapidité des processus semble faire disparaitre la frontière traitement - application. Cependant, la différence logique est bien réelle, entre « un calcul de », et un « calcul pour ».

Quelques idées d'activité sur l'utilisation des données