L’algorithme est une suite finie d’opérations (applications de règles) permettant de résoudre un problème, et d’obtenir un résultat (sortie) à partir de données de départ.
Certains auteurs l'assimilent à une sorte de “recette de cuisine”, qui bénéficie de la rapidité de calcul et d’exécution des machines.
Par exemple, on peut vouloir chercher un objet perdu dans une pièce. Une façon de faire (plutôt humaine) pourrait être de chercher d’abord dans une liste des endroits les plus probables, puis ensuite seulement de chercher dans les endroits les plus improbables (une heuristique économique, mais qui peut s’avérer plus longue au final, si l'objet est bien perdu).
Une autre façon, pourrait être de passer en revue chaque cm2, méthodiquement, en se donnant un point de départ et une direction (une heuristique certaine, mais qui est généralement plus longue à l’exécution).
Un algorithme informatique privilégiera sans doute la seconde solution, qui permet à coup sûr de trouver la solution, même si c'est un peu plus long (et des algorithmes de niveau supérieur, sélectionneront la meilleure démarche selon les contextes).
Il existe de nombreux exemples d’algorithmes simples ou complexes, pour trier, organiser, chercher, prendre une décision optimale, etc. Les algorithmes prennent une importance particulière à l'ère du Big Data, car bénéficiant d'une masse de données croissante en “entrée”, leurs résultats en “sortie” sont de plus en plus pertinents (au regard des modèles et critères de réussite qu'on leur donne).
Les entreprises disposant de fichiers clients, enregistrant des transactions multiples, peuvent vouloir améliorer leurs performances.
Les algorithmes prennent une importance particulière à l'ère du Big Data, car bénéficiant d'une masse de données croissante en “entrée”, leurs résultats en “sortie” sont de plus en plus pertinents (au regard des modèles et critères de réussite qu'on leur donne).
Par exemple, Voyages SNCF passe ainsi depuis 2014, à une logique Big Data (datavisualisation, analyses en temps réel…), et a utilisé des algorithmes de recommandation (trouver le meilleur conseil à donner à un client compte tenu de son profil, et des profils voisins, comme le fait déjà avec efficacité Amazon) pour améliorer de manière spectaculaire l'efficacité de ses Newsletters. On a assigné ici, un objectif marketing à l'algorithme. La conférence de Marie-Laure Cassé (11/2015), la directrice marketing client & data de Voyages SNCF montre clairement les apports de la data science à la connaissance client.
On constate qu’une masse de donnés « à faible information » (Big Data) produit aujourd’hui plus de résultats qu’une petite quantité d’informations très complètes (= ancienne statistique) en faisant apparaitre directement des corrélations, qui sont immédiatement utilisées pour la prévision sans nécessairement passer par une théorie explicative causale.
En effet, la masse de données permet de découvrir des corrélations utilisables économiquement (la corrélation est une relation plus ou moins forte entre variables, évoluant dans le même sens ou en sens opposé). Un exemple souvent évoqué, est celui du supermarché américain qui a découvert une surprenante et inattendue corrélation entre les ventes de bières et celles … de couche culottes ! Quelque soit la théorie explicative, la réaction logique du supermarché a été de proposer des offres commerciales groupées pour augmenter encore les ventes.
—– Dans la nouvelle statistique Big Data
Aller vers la suite : les services et métiers du web Les nouveaux services et métiers