Ceci est une ancienne révision du document !


Les nouveaux services et métiers

Le Big Data promet beaucoup. De nombreux cabinets d'études (cf. Rapport Mckinsey) présentent des projets d'application spectaculaires. L’exploitation des données à grande échelle permettrait, selon les discours de ses promoteurs (et marketeurs), de proposer de nouveaux services plus efficaces, et d'affiner les offres commerciales. Nous proposons ici une rapide caractérisation des nouveaux services que l'on peut tirer du Big Data.

  1. Une mise en relation plus fine de l’offre et de demande, et un recensement plus précis des besoins et ressources. La personnalisation des services (proposés aux clients et usagers) selon les profils constitués à partir des données recueillies (“segmentation”), permet en principe de mieux répondre aux préférences et besoins du consommateur (amélioration de la relation client),tout en réduisant le coût des campagnes de communication en les ciblant plus efficacement côté entreprises (exemple d'Amazon).
  2. L’optimisation générale des processus métiers. L’information collectée, transparente et utilisable à haute fréquence, synthétisée dans des tableaux de bords plus précis, permet d'identifier rapidement les faiblesses dans l'organisation, tout en améliorant la prise de décision (tout cela est bien entendu, source de productivité supplémentaire)… Toute la gestion des flux et des stocks est bouleversée avec des économies substantielles (gestion des ressources humaines, gestion fine des stocks, logistique…).
  3. Une nouvelle capacité à prédire. Le passage au « machine learning » avec des processeurs et des robots, qui développent une nouvelle forme d’intelligence moins procédurale, et plus « statistique » qui s'appuie sur les corrélations découvertes, sans appliquer de principes préexistants permet en effet de proposer des prédictions plus précises. Les applications sont très nombreuses : les maisons « intelligentes » qui anticipent les besoins des utilisateurs, la gestion des flux routiers (par exemple, feux de croisements) ou des parcs automobiles (anticiper le moment du renouvellement, maintenance préventive…), les villes « intelligentes » et plus sécurisées (“Smart cities”), les services de police ou d'incendie qui anticipent les lieux et moments des interventions, l'amélioration de la mobilité, la détection des risques et des fraudes… Là encore, chaque source de gaspillage de ressources est impitoyablement écartée.
  4. De nouveaux services et produits qui s'appuient sur les capteurs et objets connectés. Ces capteurs intelligents entrainent une optimisation des performances dans de multiples domaines (dont le sport, la santé avec la progression des logiques préventives et prédictives, et l’automatisation croissante des diagnostics).

Une infographie sur les attentes du Big data

De nouvelles techniques et métiers

Très logiquement, la production de ces nouveaux services nécessite de nouvelles techniques et de nouveaux métiers

  • nouveaux métiers très spécialisés (data-scientits, data-journalisme…)
  • utilisation de nouvelles techniques de gestion des bases de données non relationnelles (souvent Nosql)
  • systèmes techniques informatiques nouveaux (Hadoop pour travailler sur des machines parallèles) pour traiter des quantités de données gigantesques et croissantes,
  • stockées dans des locaux physiques (Data Centers dans lequel sont localisés notamment les services Clouds : on en compterait environ 4200 en 2015 dans le monde).
  • infrastructure de distribution électrique importante : les datas centers consomment plus de 2% de la consommation mondiale d’électricité en 2015. Google, dans l'Iowa, Charbon, fait un effort de refroidissement particulier

Data Mining, Data-scientist et corrélations


Source : DataCamp.com

Le Data-mining consiste à extraire des informations utiles dans une masse de données, en utilisant des technologies particulières (Big analytics). Le data-scientist est celui qui va mettre en œuvre ces technologies informatiques et statistiques.

Métaphoriquement, on peut considérer que le Big Data constitue une montagne (de données) dans lequel le data-mineur va creuser avec sa pelle et sa pioche (outils statistiques) pour trouver des pépites (des corrélations), créatrices de valeur économique.

Le métier de « data scientist » est en plein essor. Les savoir-faire mobilisés sont en effet très spécifiques. Traditionnellement, les sciences sociales utilisent les corrélations (qui sont parfois le fruit de coïncidences, ou le résultat de variables tierces cachées) comme un point de départ, un indice, un signal pour trouver un modèle explicatif théorique causal (qui est ensuite testé, et peut permettre de produire des prévisions).

Or, la masse des données collectées permet de passer directement des corrélations statistiques aux prédictions sur une base probabiliste, sans passer par un modèle causal. La corrélation découverte se suffit (rait) en elle-même pour produire des prévisions robustes.

Le data-scientist se contente alors de calculer, et de fournir des faits statistiques, qui en retour peuvent influencer les comportements (société « Data-driven »).

Exemples d'utilisation du big data dans le commerce et le marketing

Exemples d'utilisation du big data dans l'industrie

Exemples d'utilisation du big data dans l'agriculture

Exemples d'utilisation du big data dans les services à la personne

Exemples d'utilisation du big data dans la santé

Exemples d'utilisation du big data dans le sport