L’internet des objets, l’interconnexion généralisée transformant les services et les comportements des internautes en fournisseurs de données et d’une manière générale les évolutions technologiques liées aux capacités computationnelles qui traitent l’information sur toute sa chaîne de transformation nous pressent d’interroger l’effervescence actuelle autour du « Big Data », qui anime autant les milieux d’affaires que les gouvernements et les scientifiques d’origine disciplinaire variée.
Buzzword ayant le vent en poupe ces trois dernières années, le « Big Data » souvent désigné comme une « mine d’or » qualifiant un « océan mondial de données » révèle la prise de conscience de l’expansion rapide d’un nouvel univers constitué par des données dont le traitement formerait un monnayable eldorado. Le « Big Data » vise ainsi l’exploitation massive de données informationnelles présentes, fabriquées ou générées en ligne, dans des cadres juridiques en cours de définition et de négociation.
Au terme « Big Data », se trouve fréquemment associé « Open Data » qui apparaît comme une condition associée, au moins dans la sphère publique. Dans le domaine de la recherche, le mouvement du libre accès aux résultats scientifiques - que ce soit les textes ou les données – est en phase avec cet enjeu majeur d’exploration et d’interconnexion sans limites de ces données, au cœur des promesses du datamining. Les démocraties se sont emparées elles-aussi de cet idéal d’ouverture et construisent un accès renouvelé aux données publiques projetant des valeurs de transparence, de participation citoyenne, de soutien à l’innovation économique. Ceci démarre en 2009 par l’ouverture du site data.gov de l’Open Government d’Obama, puis encouragé par l’Union Européenne le mouvement se traduit en France par le développement actuel de la « Plateforme ouverte des données publiques françaises », data.gouv.fr. Il en est de même pour le Maroc à travers sa plateforme dédiée aux données publiques (data.gov.ma). Ainsi, la France se classe 10e sur 77 dans le baromètre 2013 de l’Open Data Institute et le Maroc 40e . Enfin, autre phénomène et non des moindres en terme de prolifération des données, celles livrées gratuitement par les internautes sur les réseaux sociaux, services, blogs, sites web d’agrégation d’informations vidéos, images, textes…et potentiellement exploitables par le marketing et tous les services dont les objectifs reposent sur la réalisation de prévisions.
Au sein des entreprises, de nombreux projets voient le jour dont les visées vont d’une simple optimisation des performances à une transformation profonde des modèles d’affaires. La visualisation de données devient un enjeu associé à l’efficience du pilotage. La possibilité d’une prise de décision en temps réel et l’enrichissement des données habituelles par de nouvelles sources de granularités plus fines permettent d’ajuster la relation continue avec le client, de concevoir des produits et services affinés en fonction du profil et des besoins. Enfin, nombreuses sont les opportunités liées à l’accès, au volume et à la nature des données pour les gouvernements à travers la santé, la sécurité, le climat, l’urbanisme, les médias, l’emploi et autres domaines qui structurent profondément une société, voire les relations internationales.
La « création de valeur » - dont le concept est à interroger - semble se dégager à travers les approches de ces différents domaines, mobilisant des enjeux d’innovation et de nouvelles opportunités économiques. La disponibilité de données massives conduit à appréhender des métriques différentes, à considérer des corrélations inédites de données et à développer les modèles « prédictifs ». Pour la recherche, le défi consiste à construire, partager et vérifier des preuves scientifiques supplémentaires, à réutiliser les données et à en extraire de nouvelles hypothèses.
Cependant, si ces challenges de l’Open Data et du Big Data sont plébiscités par de nombreux acteurs, ils impliquent néanmoins un ensemble de problématiques sensibles vu leur transversalité, leur ampleur et leur impact social potentiel. L’une des questions principales au centre des débats reste la protection des données personnelles. Qu’il s’agisse d’informations réelles sur un individu (son identité, le résultat de son travail, ses préférences, son comportement, son passé, ses besoins en temps réel, ses données de santé ou bancaires,…), ou d’informations virtuelles de son ombre numérique, les notions de propriété et de confidentialité des données restent centrales. Les discussions et réflexions en termes juridiques, citoyens, mais aussi commerciaux animent actuellement les débats en France notamment par l’action de la CNIL, au sein de l’Union Européenne, à travers l’élaboration en cours d’une nouvelle directive européenne visant l’harmonisation des pratiques, et au Maroc avec la réalisation des premiers contrôles pour assurer la protection des données personnelles par la CNDP selon l’article 24 de la nouvelle Constitution[1] qui garantit le droit à la vie privée et le secret des communications. L’anonymisation des données ne semble pas aujourd’hui être une solution suffisante.
Qu’il s’agisse d’une rupture technologique comme le laissent entendre les discours de certains acteurs promoteurs d’un nouvel écosystème, d’une innovation en termes de modèles économiques et sociaux, d’une évolution de la performance des outils existants ou d’un simple effet de mode, ce phénomène transverse s’inscrit au cœur de nombreux travaux de recherche en sciences de l’information et de la communication, mais aussi en sciences de gestion, informatiques, sociales, et plus généralement les sciences dont les expérimentations quantitatives font appel à des volumes de données significatifs, comme la génomique, la météorologie, l’épidémiologie, la criminologie, etc.
Différents enjeux intéressant les Sciences de l’information et de la communication méritent d’être mis en perspective. Cette cinquième conférence « Document numérique et Société » favorisera les observations et les retours d’expériences mais aussi les réflexions théoriques et critiques sur les modèles que le « Big Data » suscite et plus particulièrement ceux qui renouvellent le champ des sciences de l’information et de la communication :
- Les enjeux techniques liés à la structuration et à la construction des connaissances : pour pouvoir être analysables, réutilisables, combinables, agrégeables, les données doivent être structurées. Le renforcement de la convergence des systèmes d’identification des ressources documentaires avec celles du web, la constitution de schémas de métadonnées, favorisent l’interopérabilité des systèmes et les calculs sur les données. Des études de cas relatant des retours d’expérience pourraient être intéressants aussi bien en provenance des institutions publiques que des entreprises. En matière de construction de savoirs, quelles sortes de connaissances est-on susceptible de construire par le croisement des données ?
- Les enjeux sociétaux liés aux usages du « Big Data ». Les stratégies d’ouverture et de partage des données ne renouvellent-elles pas une forme de dictature de la transparence en revendiquant un « changement de culture » basé sur l’abandon de la protection des données personnelles ? Tant les comportements que développent les usagers face à l’exploitation de leurs données que les régulations et les réglementations à envisager devraient être examinés.
- Les enjeux industriels et professionnels : on peut s’interroger sur le profil des organisations tirant déjà profit de cette ouverture, sur le poids des géants du web dans la redistribution de la valeur. Des compétences spécifiques apparaissent nécessaires pour travailler les données : s’agit-il d’une acculturation générale au datamining ? Quelles spécialisations pour les « nouveaux » métiers tels les data-journalistes, data-scientifiques ?
- Les enjeux épistémologiques liés au renouvellement des cadres d’analyse et d’interprétation, les nouvelles métriques, les nouveaux modèles d’affaires, seront également à mettre en perspective.
Sont concernées par ce colloque les recherches théoriques et expérimentales qui s’inscrivent dans la perspective des études sur le phénomène du Big Data en termes d’enjeux pour nos sociétés et de création de valeurs. Sans être limitatives, voici quelques thématiques sur lesquelles pourraient porter les communications des auteurs :
- Nouveaux rôles pour les bibliothécaires et documentalistes (data scientist, digital curation librarian, data manager…)
- Data-journalisme
- Applications du « Big Data » notamment dans le domaine de l’intelligence compétitive
- Big Data et open governement
- Big Data et open science : impact sur la recherche scientifique
- Cadre juridique du Big Data (protection des données personnelles, copyright, droits d’auteurs
- Comportement des usagers face à l’open data, le big data
- Ethique informationnelle
- Innovation de services et open data
- Data-visusalisation
- Tendances émergentes en sciences de l’information induites par le Big Data
- Adaptation des normes et des standards (taxonomies, schémas de métadonnées…)
- Management des données du SI (SIGB, dépôts institutionnels, plateformes d’e-learning)
- Big data et pilotage des fonctions de l’entreprise
- Epistémologie du big data…
[1] Le Maroc a adhéré à la convention 108 du Conseil de l’Europe pour la protection des personnes à l'égard du traitement automatisé des données à caractère personnel.