Les données d’adresses sont un actif important de toutes municipalités, tous comtés et autres organisations gouvernementales. Pour plusieurs, leur gestion peut sembler banale, mais en réalité, elles représentent un jeu de données plus délicat à gérer qu’il n’y parait, autant en raison de leur volume que du type d’information qu’elles contiennent. Dans la réalité, une adresse est plus qu’un numéro, une rue et un code postal. Elle est aussi associée à une localisation et son positionnement sur le territoire doit être le plus précis possible.
Qui utilise les données d’adresses?
À l’intérieur d’une ville, plusieurs départements utilisent directement et indirectement les données d’adresses. Par exemple, la direction de l’aménagement et de l’urbanisme doit veiller au développement de nouveaux quartiers, pour lesquels de nouvelles adresses seront créées. La poste doit livrer le courrier et les colis aux bons destinataires. La taxation doit fournir les relevés aux différents propriétaires situés sur son territoire. À un autre niveau, les services de police et incendie utilisent ces informations pour intervenir en cas d’urgence.
À quoi ça ressemble?
En géomatique et en cartographie, les données des adresses sont généralement présentées sous forme de points (forme ponctuelle). Chaque point représente l’adresse de la propriété sur laquelle il se situe. Selon l’utilisation, le point peut se trouver au centre du lot (centroïde) ou sinon plus proche de la rue à laquelle il est associé.
Associée aux points, une table d’attributs contient généralement l’information pertinente associée à l’adresse, telle que le numéro civique, le nom de rue et le code postal. On y retrouvera également des informations pour utilisation interne telles que la date de mise à jour et un identifiant unique. Couplée avec les données d’évaluation, on peut également y joindre le nom du ou des propriétaires, le numéro de matricule, l’année de construction du bâtiment, le zonage, etc.
Qu’est-ce que la validation spatiale?
La validation spatiale s’assure que la donnée est bien représentée dans l’espace. On valide donc si la localisation est bonne, mais aussi que la forme géométrique, les dimensions et les relations avec les entités environnantes sont bien respectées. Dans le cas des coordonnées d’adresses (ponctuelles), nous cherchons autant à valider la localisation que la relation avec les entités environnantes dans l’espace comme la distance par rapport aux rues et aux autres points d’adresses.
La validation spatiale est complémentaire aux processus de validation de données attributaires, où l’organisation vérifie que la donnée non spatiale liée aux adresses soit valide et qu’elle respecte un standard prédéfini (numéro civique, nom de rue, code postal, etc.) et tout autre élément de validation pertinent pour l’organisation.
Pourquoi est-ce important?
Pour les services d’urgences tels que les pompiers et la police, il est crucial que les données et la localisation soient précises. Une erreur dans la localisation peut amener ces intervenants à se présenter au mauvais endroit et causer des délais d’intervention. Pour les autres services de la ville, une donnée erronée ou mal située peut causer des préjudices aux citoyens et engendrer des retards et des coûts additionnels dans les mises à jour des systèmes internes.
L’importance d’une stratégie de tests
Plusieurs situations problématiques peuvent survenir lors de la validation spatiale des adresses. Pour les identifier, il est donc important de tester la donnée à différents niveaux pour obtenir un bon portrait de la situation. Il est crucial de corriger les situations problématiques pour augmenter la qualité des données et surtout, le niveau de confiance lors de la prise de décision. Les questions suivantes sont des exemples d’éléments à vérifier lors d’une validation spatiale :
- Est-ce qu’il manque des points d’adresses (comparé aux données de taxation ou d’autres systèmes)?
- Est-ce que des points d’adresses sont superposés?
- Est-ce qu’il y a des doublons?
- Est-ce que des adresses sont représentées par une géométrie autre qu’un point (petit cercle par exemple)?
- Est-ce que l’adresse est située à proximité de la bonne rue?
- Est-ce que le point d’adresse est du bon côté de la rue?
- Est-ce que les points d’adresses sont disposés dans le bon ordre?
- Est-ce que les points d’adresses tombent à l’intérieur des limites de la ville?
Comment peut-on améliorer la situation?
Tout d’abord, il faut déterminer le niveau de qualité à obtenir pour nos données spatiales. Définir précisément quels types d’erreurs doivent être corrigées, lesquels sont tolérables ainsi que le niveau de priorité dans lequel il faut prendre en charge les problèmes. Lorsque les règles d’affaires sont bien définies, il est plus simple de créer les tests géomatiques qui permettront d’interroger la donnée et de fournir un portrait de la situation.
L’ETL à la rescousse
Pour être efficace dans la création et la réalisation d’un processus de test, l’utilisation d’un outil ETL peut s’avérer très pertinente et performante. Un logiciel tel que FME permet d’interroger la donnée rapidement afin d’en ressortir automatiquement les informations désirées. Il est également possible de produire des rapports personnalisés détaillant précisément les corrections à effectuer ainsi qu’une carte pour visualiser les points d’adresses à corriger.
Et maintenant?
Il n’est jamais trop tard pour améliorer la qualité de vos données d’adresses. Si vous ignorez leur degré de qualité actuelle, il serait utile de faire les tests pour vous éclairer et connaitre les écarts. Dans le meilleur des cas, les erreurs seront peu nombreuses et faciles ou rapides à corriger. Dans le pire des scénarios, vous aurez au moins l’heure juste! Restera à établir un plan par étapes pour les corriger. À la fin du processus, vous serez plus confiant envers vos données d’adresses et vos collègues et citoyens en bénéficieront.
Besoin d’aide pour mettre en place une stratégie de validation et correction des données d’adresses?