Le domaine des technologies de l’information abonde de termes similaires qui peuvent parfois porter à confusion. Dans les dernières années, nous avons vu émerger plusieurs nouvelles expressions, dont «open data» et «big data». Ces deux termes fort importants marquent l’évolution des données numériques dans une ère où Internet est roi. Sauriez-vous les définir et les différencier?
BIG DATA: QUAND LES DONNÉES S’ACCUMULENT
Nous vivons dans un monde connecté où des quantités phénoménales de données sont enregistrées à toutes heures du jour et de la nuit. Selon IBM, 2,5 quintillions d’octets de données sont créés quotidiennement. Que l’on parle de «mégadonnées» ou de «données massives», ces mots font référence à l’information qui s’accumule et qui est stockée en temps réel sur des serveurs à travers le monde.
Il faut savoir que ces données, même si elles sont conservées, ne sont pas nécessairement utiles ou utilisables. Si le potentiel de les exploiter existe, on estime cependant à moins de 1% les données qui sont analysées. Pourquoi? Leur format et leur structure rendent souvent cette tâche trop ardue ou trop longue. Toutefois, de nouveaux outils voient constamment le jour pour tirer parti de ce qui représente une mine d’or pour certaines entreprises.
OPEN DATA: QUAND LES DONNÉES S’OUVRENT AU MONDE
Alors que le Big Data se définit par son ampleur, l’Open data se définit par son usage. L’ouverture des données, c’est en fait l’intention de démocratiser l’information pour en faire bénéficier un groupe ou une population. Diffusées sous une licence ouverte garantissant son libre accès, les données doivent être offertes sans restriction technique, juridique ou financière.
La démocratisation se fait de façon structurée par un ensemble de méthodes et de formats permettant le partage et la compréhension des données. Des entreprises, ou même des citoyens ayant des compétences en programmation, peuvent alors utiliser ces données pour les analyser, en ressortir des tendances et informer le public. L’Open data ouvre d’énormes possibilités de collaboration pour résoudre des problèmes complexes.
Consultez notre article sur les villes intelligentes à l’heure des données ouvertes
Plusieurs données ouvertes proviennent des réseaux sociaux dont l’information est accessible publiquement, comme celles de Twitter. On voit aussi de plus en plus de scientifiques qui publient leurs résultats en format ouvert. Cela génère des collaborations très porteuses qui font avancer la science.
QUELQUES PRÉCISIONS IMPORTANTES
Les mégadonnées ne sont pas toutes ouvertes. Les données qu’accumulent les opérateurs d’appareils mobiles ou les banques ne seront jamais disponibles au public. Ces données n’apportent des avantages qu’à ceux qui les possèdent, ce qui peut d’ailleurs soulever certains problèmes éthiques.
Les données ouvertes n’ont pas besoin d’être énormes. Des données en quantité modeste peuvent avoir un grand impact quand elles sont dévoilées publiquement. À ce titre, des informations municipales concernant certains services peuvent aider les citoyens à prendre de meilleures décisions ou à améliorer leur qualité de vie. Aimeriez-vous, par exemple, savoir à quel moment la piscine est le moins bondée?
LES DEUX TYPES DE DONNÉES PEUVENT-ILS ÊTRE COMBINÉS?
Les données ouvertes et les grandes quantités de données peuvent tout à fait être utilisées ensemble pour générer une information plus complète, plus visuelle et plus compréhensible.
Traiter et croiser beaucoup de données représente bien sûr un défi technologique, mais cela permet d’illustrer l’information sous des angles nouveaux. À ce titre, le projet HUBCAB de Senseable City Lab du MIT, est particulièrement intéressant. Afin d’analyser de façon poussée la mobilité dans la ville de New York, l’équipe a capté les 170 millions de courses de taxis effectuées dans la ville en un an. Ces voyages ont été cartographiés en utilisant des données ouvertes. Le but était de comprendre les habitudes de déplacement afin d’en ressortir des modèles (patterns) qui permettent ensuite d’imaginer des façons de réduire les coûts sociaux et environnementaux des transports. Le principe de « taxi shareability » est au cœur de cette initiative. Leur étude a démontré que 40 % des courses de taxis peuvent être partagées!
En conclusion, les mégadonnées permettent d’accéder à un niveau de compréhension et d’analyse jamais atteint et l’ouverture des données nous assure que cette connaissance sera bénéfique pour la population. Le Big Data et l’Open data transforment les entreprises, les gouvernements et la société. Et combinés, ils sont particulièrement puissants.
Source: The Guardian
VOUS VOYEZ DES OPPORTUNITÉS POUR VOTRE ENTREPRISE OU SOUHAITEZ EN SAVOIR PLUS?