La qualité des données, pourquoi fait-elle encore débat ? (mercredi 5 mai)
La notion de qualité est cernée depuis plusieurs années. Pourtant, les producteurs de données métiers hésitent à diffuser leurs données car elles ne sont pas de qualité suffisante à leurs yeux. Comment changer notre regard sur la qualité et bâtir des systèmes de certification efficaces ? Les métadonnées sont-elles la seule panacée ? Doit-on encore parler de qualité ou d’adéquation à l’usage ? Exemples et réflexions ont alimenté le débat. Cette session s’est achevée par une table-ronde : La question de la qualité à l’heure de la géomatique collaborative.
Président de session : Gilles Troispoux, pôle géomatique du CERTU, MEEDDM - mercredi 5 mai
9h30-10h00 : La recherche sur la qualité de l’information géographique : solutions, enjeux et perspectives par Rodolphe Devillers, Université de Terre-Neuve (Canada)
Cette présentation vise à présenter un portrait général de l’état de la recherche dans le domaine de la qualité de l’information géographique, ainsi que de mettre en relation les résultats de recherche avec la pratique professionnelle. Un bref historique des résultats principaux obtenus en recherche dans les dernières décennies et de leurs impacts sur le plan opérationnel sera d’abord effectué. Il portera principalement sur le développement de méthodes permettant de mesurer ce que l’on appelle la « qualité interne » (le niveau d’adhérence entre données produites et données qui auraient dû être produites). Ensuite, la présentation s’orientera sur des problèmes plus récents consistant à assister les utilisateurs dans l’évaluation de l’adéquation entre données et usages, appelé « qualité externe ». Les récentes avancées en recherche sur ce thème, ainsi que les problèmes rencontrés, seront résumés et des perspectives de solutions seront suggérées, montrant que malgré des décennies de recherche sur le thème, la qualité des données fait encore bel et bien l’objet de débats…
10h00-10h30 : Évaluation et communication de l’impact de la précision géométrique, proposition d’un modèle basé sur la connaissance des processus de production par Jean-François Girres, COGIT-IGN
L’évaluation de la précision géométrique constitue un enjeu majeur dans le cadre de la mise à disposition des bases de données géographiques. La communication de cette information et de son impact est fondamentale pour l’utilisateur final, afin d’éviter une mauvaise perception de l’espace, ou une sur ou sous évaluation de phénomènes.
Cette information, bien que généralement renseignée par les producteurs de données (sous forme d’erreur moyenne quadratique par exemple) n’est pas formulée de manière compréhensible, et finalement manipulable, pour l’utilisateur final. Par exemple, comment informer l’utilisateur du risque d’erreur sur un calcul simple (d’aire ou de longueur) à partir du jeu de données qui lui est fourni? Cette information sur l’incertitude liée à l’usage du jeu de données, est bien plus délicate à fournir qu’il n’y parait, d’une part parce que l’information sur la précision géométrique, même renseignée, n’est pas facilement exploitable, d’autre part parce que les usages peuvent varier infiniment.
Les méthodes de contrôle qualité traditionnelles, à partir d’un jeu de données de référence de résolution supérieure, peuvent permettre de renseigner cette incertitude, mais le problème se pose davantage lorsque pas ou peu de données de référence sont disponibles. Dans ce cas, la connaissance des sources potentielles d’erreurs durant la production du jeu de données offre une piste intéressante afin d’évaluer l’incertitude portée par le jeu de données à évaluer.
L’exposé présentera ce travail de recherche, qui fait l’objet d’une thèse de doctorat engagée en 2009 au sein du laboratoire COGIT, sur la conception d’un modèle d’évaluation des imprécisions géométriques dans les données vectorielles. Le but de ce travail consiste à faciliter l’évaluation d’un jeu de données à partir d’hypothèses sur le processus de production, afin de fournir une information exploitable pour l’utilisateur final.
10h30-11h30 : Pause
11h30-12h00 : Apport de la géovisualisation pour la cartographie de l’incertitude : application aux évènements liés aux risques naturels par Aurélie Arnaud, laboratoire Pacte-Territoire
L’étude des risques naturels repose, entre autre, sur la connaissance des évènements passés. Cette dernière s’appuie, de plus en plus sur l’outil cartographique, moyen de communication, de diffusion mais aussi outil d’analyse d’information et de production de nouvelles connaissances. Les évènements passés sont décrits par un ensemble d’informations multidimensionnelles (espace, temps, attributs thématiques, documents), issues de sources hétérogènes plus ou moins précises, comprenant une part importante d’expertise mais aussi d’incertitude liée à la complexité du phénomène à étudier ainsi qu’aux interprétations humaines et techniques. L’information incertaine peut concerner l’objet spatial lui-même (forme, position), ses attributs thématiques ou documentaires, ses caractéristiques temporelles, mais aussi les sources à partir desquelles sont issues les données. Renseigner sur l’incertitude de l’information constitue un enjeu majeur pour l’amélioration des connaissances liées aux risques et la prise de décision. Toutefois, l’incertitude est rarement prise en compte dans les productions cartographiques, même si cette notion est reconnue comme une dimension intrinsèque de l’information sur les risques naturels ; ceci est lié essentiellement aux caractéristiques de la modélisation cartographique classique: Comment afficher sur une carte, déjà très chargée en information, cette dimension ? Comment assurer la lecture, la compréhension et l’analyse des niveaux d’incertitude attachés aux objets spatiaux ainsi qu’à ces différents composants ? Comment éviter la surcharge cognitive d’une carte représentant des informations multidimensionnelles et complexes ? Aujourd’hui, les nouvelles techniques de cartographie offertes par la géovisualisation ouvrent des opportunités pour rendre compte de la complexité croissante de l’information geo-référencée.
Notre objectif est donc de proposer des méthodes et outils pour rendre compte de la dimension incertaine qui peut caractériser l’information sur les événements liés aux risques naturels, en nous appuyant sur la géovisualisation et la définition de variables géovisuelles venant compléter le langage cartographique.
12h00-12h30 : Est-ce la qualité des données qui fait débat ou la compréhension des données et la définition des besoins ? par Henri Pornon, Ieti Consultants
Pour aborder correctement le problème de la qualité des données et changer notre regard sur la qualité, il faut en premier lieu rappeler quelques fondamentaux :
- une donnée n’est pas donnée mais construite, ce qui signifie qu’elle ne peut en aucun cas avoir un caractère d’universalité.
- Les problèmes de qualité peuvent résulter d’inadéquation entre l’objectif initial de production et le résultat atteint, mais résultent en fait plus souvent du décalage entre les objectifs de production et les attentes d’utilisation.
- Le débat sur la certification des données est inséparable de celui concernant leur standardisation.
Ceci nous conduit à nous demander si le problème de la qualité des données est un problème de spécification, de contrôle ou d’usage. En effet, au-delà du débat sur l’utilité des métadonnées ou de la nécessité de dispositifs de certification (qui ne peut concerner que des données standardisées), la question est surtout celle de la rencontre entre les exigences et objectifs respectifs des producteurs et des utilisateurs de données. Cette question se traite différemment suivant qu’on se situe dans une logique marchande (producteur de données sur étagères proposant des bases de données standardisées, processus de production à façon d’un fournisseur pour un client) ou dans une logique partenariale (échange et mutualisation de données métiers).
12h30-14h30 : Déjeuner
15h00-15h30 : Retours d’expérience sur le management de la qualité des données dans des projets internationaux par Sophie Reynard, IGN
Retour d’expérience en management et contrôle qualité dans des projets d’acquisition d’information géographique et d’intégration SIG. Projets de SIG cadastral au Nicaragua, SIG en agronomie en Égypte, et refonte de la chaine cartographique du Survey of Bangladesh. Comment maitriser la qualité de la donnée au fil de la chaine de production en contrôlant les entrants et les processus ? Comment estimer la qualité d’un produit en sortie ?
15h30-16h00 : Une approche pragmatique de la qualité des données en Charente-Maritime par Emanuel Jobin, SI 17 .
Notre retour d’expérience de 10 ans d’une politique départementale SIG a permis d’identifier localement différents problèmes liés à la qualité des données, à leurs échanges et surtout à leur réutilisation dans les différents SIG des services publics locaux. La qualité des données revêt plusieurs facettes et elle est de la responsabilité des producteurs de données (locaux et nationaux). Fort de ce constat, il s’est avéré nécessaire d’aborder de façon simultanée les réponses à mettre en œuvres afin qu’elles soient pérennes en appliquant les processus de subsidiarité, d’interopérabilité et de consensus.
L’analyse des différents aspects de modélisation, construction, mise à jour, contrôle, échanges et coordination des acteurs dans leur rôle de « producteurs de données » ont permis, au regard des problématiques identifiées, de construire des solutions dénommées en Charente-Maritime « Géoservices », déclinable par thématique.
3 Géoservices seront présentés de façon succincte. Ils permettent de démontrer que des actions locales peuvent être mises en œuvre, mais qu’elles doivent être combinées de façon systématique avec le niveau national dans le cadre d’une animation-coordination des différents acteurs :
- Amélioration de la qualité du PCI Vecteur (propriété privée) ;
- Appariement de données autour de la thématique « voirie » ;
- Expertise de la qualité sur les données littorales à travers le site pilote Marennes Oléron.
16h00-17h00 : Pause
17h00-18h00 : La question de la qualité à l’heure de la géomatique collaborative, table-ronde animée par Serge Mang (Gaiago), avec Bernard Allenbach (SERTIT), Michel Dériaz (arx iT), Emilie Laffray (U-Block), Charles Millot (SDIS 89) et Gaël Musquet (contributeur OSM).
L’information géographique touche un public nouveau (nouveaux métiers, ouverture vers le grand public). Par ailleurs, les cartes sont « brouillées » et les utilisateurs peuvent aussi bien être des producteurs. Du B2B (business to business), on est passé au B2C (business to consumers), et le marché glisse doucement vers le C2C, voire le C2B ! Les problématiques de qualité inhérentes à cette évolution sont totalement nouvelles. D’une part parce que la manière de produire a changé, mais aussi parce que l’approche de la qualité a radicalement évolué. La donnée géographique, hier qualifiée uniquement par des critères quantitatifs objectifs comme la précision géométrique, se transforme peu à peu en degré de satisfaction apporté aux utilisateurs.
Les concepts « ISO 19113″ et « contribution bénévole » convergent progressivement. La table ronde proposera un débat entre utilisateurs, producteurs traditionnels, chercheurs et coproducteurs de plateformes géographiques collaboratives et interrogera sur la convergence des problématiques de qualité entre usages professionnels et grand publics.
Vous pouvez poser vos questions aux intervenants de la table-ronde, poursuivre le débat, donner votre point de vue en vous connectant sur notre plate-forme de débats en ligne : http://www.debat-sig-la-lettre.com/fr/
Un compte-rendu de cette table-ronde sera prochainement en ligne