Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
le_monde_merveilleux_du_big_data:donnee_petrole [2016/10/07 23:19] superwiki [Les 3 V] |
le_monde_merveilleux_du_big_data:donnee_petrole [2017/01/17 12:23] superwiki |
||
---|---|---|---|
Ligne 50: | Ligne 50: | ||
On peut proposer une rapide caractérisation des nombreuses sources de données numériques, pour saisir à la fois l’ampleur des volumes, mais aussi l’incroyable diversité des formes : | On peut proposer une rapide caractérisation des nombreuses sources de données numériques, pour saisir à la fois l’ampleur des volumes, mais aussi l’incroyable diversité des formes : | ||
+ | |||
Le plus évident : la communication sur le Web, et les contenus générés par les interactions humaines sur le Web | Le plus évident : la communication sur le Web, et les contenus générés par les interactions humaines sur le Web | ||
*Le « vieux » Web : les 20 milliards de sites web et leurs pages innombrables (30 000 milliards de pages … en 2013, indexées par Google, 500 à 1000 sites de plus par minutes en 2015), les requêtes sur Google (3 à 4 millions…par minute en 2015).., les courriels échangés (plus de 200 millions par minutes en 2015), les innombrables commentaires sur des sites webs ou forums… | *Le « vieux » Web : les 20 milliards de sites web et leurs pages innombrables (30 000 milliards de pages … en 2013, indexées par Google, 500 à 1000 sites de plus par minutes en 2015), les requêtes sur Google (3 à 4 millions…par minute en 2015).., les courriels échangés (plus de 200 millions par minutes en 2015), les innombrables commentaires sur des sites webs ou forums… | ||
Ligne 55: | Ligne 56: | ||
*L’upload et la consultation de documents numérisés sur le « Cloud » (qui sont en fait des serveurs physiques distants) : des images et photos (Whats Apps, Instagram, etc.), des textes, et des vidéos de plus en plus lourdes (60% du trafic web, 4 milliards de vue par jour pour YouTube, 300h de vidéo de plus par minute en 2015, 400h en 2016), des applications et jeux Web 2.0… | *L’upload et la consultation de documents numérisés sur le « Cloud » (qui sont en fait des serveurs physiques distants) : des images et photos (Whats Apps, Instagram, etc.), des textes, et des vidéos de plus en plus lourdes (60% du trafic web, 4 milliards de vue par jour pour YouTube, 300h de vidéo de plus par minute en 2015, 400h en 2016), des applications et jeux Web 2.0… | ||
*Les données de connexion, les historiques, fichiers journaux et autres logs, de chacun auprès des fournisseurs d’accès : il y a quand même plus de 3 milliards d’internautes en 2015. | *Les données de connexion, les historiques, fichiers journaux et autres logs, de chacun auprès des fournisseurs d’accès : il y a quand même plus de 3 milliards d’internautes en 2015. | ||
+ | |||
Ajoutons les données produites par l’activité humaine | Ajoutons les données produites par l’activité humaine | ||
*Les vidéos et sons archivés, produits par les chaines de TV et de Radios | *Les vidéos et sons archivés, produits par les chaines de TV et de Radios | ||
Ligne 69: | Ligne 71: | ||
D’autres instituts, ajoutent que cela crée de la Valeur (Value, qu’il faut pouvoir mesurer), sous condition de Véracité (sincérité, fiabilité) et de Visibilité (les données sont présentées dans des tableaux ou data-viz compréhensibles){{ :le_monde_merveilleux_du_big_data:big-data-attributes-4v.jpg |}} | D’autres instituts, ajoutent que cela crée de la Valeur (Value, qu’il faut pouvoir mesurer), sous condition de Véracité (sincérité, fiabilité) et de Visibilité (les données sont présentées dans des tableaux ou data-viz compréhensibles){{ :le_monde_merveilleux_du_big_data:big-data-attributes-4v.jpg |}} | ||
+ | Aller vers la suite : les algorithmes [[le_monde_merveilleux_du_big_data:algorithmes|A quoi sert un algorithme ?]] | ||