Qualité de la donnée : les 5 erreurs les plus fréquentes (et comment les éviter)

DAF dans une grande entreprise ou une ETI, vous connaissez l’importance du pilotage de la data dans votre organisation. Au cœur de la machine et des processus qui contribuent aux prises de décision, vous ne pouvez pas transiger avec la qualité de la donnée. Les enjeux financiers, stratégiques comme concurrentiels exigent de s’en préoccuper tout le temps. 

Pourtant, nous rencontrons des erreurs récurrentes dans les entreprises au cours de nos missions. Elles sont évitables. Nous vous les détaillons dans cet article, sachant que les détecter constitue souvent le début de la solution pour les éradiquer.

Préambule : les critères pour apprécier la qualité de la donnée

La notion de data quality regroupe à la fois les caractéristiques que doivent détenir les données et tous les processus qui contribuent à les garantir. D’une manière générale, une donnée de qualité doit répondre aux besoins et exigences de son exploitation.

Les critères à examiner comprennent :

  • la pertinence, soit l’utilité réelle de la donnée ;
  • l’exhaustivité ;
  • l’unicité donc l’absence de doublons ;
  • la fiabilité ou exactitude ;
  • l’intégrité et la sécurité ;
  • la complétude, soit la présence d’une valeur ou information renseignée ;
  • la conformité aux lois ou règlements ;
  • l’accessibilité ;
  • la rapidité de mise à jour.

1 – Des données peu adaptées aux besoins des métiers dans l’entreprise

C’est pourtant la base pour des données de qualité. Elles doivent répondre à une utilité précise pour un ou plusieurs métiers dans l’entreprise. Divers cas se rencontrent, souvent du fait d’un travail incomplet d’identification des besoins.

Toutes les situations suivantes dénotent une inadéquation entre la data disponible et les attentes des utilisateurs :

  • Certaines informations cruciales pour la stratégie ne sont pas mises à disposition simplement et rapidement, ce qui handicape la prise de décision. 
  • L’entreprise présente une pléthore d’informations dont personne ne se sert, ce qui crée parfois un sentiment d’infobésité.
  • Des données restent peu exploitées, notamment certaines données non structurées, faute d’outils, alors qu’elles constituent une mine d’or informative sur le plan commercial par exemple.
  • L’actualisation des données s’avère trop longue ou complexe. Ce manque de fraîcheur pénalise la prise de décision et l’action.

2 – Absence de processus structuré de data management dans l’entreprise

Parfois, malgré une taille d’entreprise conséquente, la gouvernance de la data fait défaut ou manque de cohérence. Plus les données proviennent de sources différentes, avec de nombreuses sociétés dans le groupe, sans oublier le big data pour les informations externes, plus le data management s’organise.

“Au-delà des diverses sources, il faut qualifier la donnée pour la rendre exploitable et indiscutable selon les acteurs dans l’entreprise.”

H. Dusanter, CFO

Voici des exemples pour illustrer ce type d’erreur qui conduit à une qualité de la donnée insuffisante.

2.1 – Gouvernance de la data : pas de réel pilote dans l’avion

Au-delà de la DSI et de la DAF, la gestion des données exige dans les entreprises de grande taille de disposer d’un data manager. Sans cet acteur incontournable, il est fort à craindre que la qualité des données ne soit pas au rendez-vous.

“Les équipes financières peuvent alors challenger et utiliser la donnée pour la construction et la mise à jour des budgets.”

H. Dusanter, CFO

2.2 – Mauvaise définition ou gestion des référentiels de l’entreprise

Lorsque la fonction de data manager n’existe pas clairement, vous rencontrez parfois des déficiences au niveau du MDM, le master data management. Pourtant, le pilotage strict et cohérent des référentiels constitue un socle essentiel à la qualité des données. Tiers (clients, fournisseurs et salariés) comme articles, toutes ces données conditionnent la plupart des flux physiques ou financiers de l’entreprise.

2.3 – Une conformité insuffisante des données aux normes et réglementations

Un mauvais data management peut générer des failles dans le respect des normes ou lois. Citons les obligations fiscales liées à la facturation par exemple ou le RGPD. Quelle que soit la donnée, son pilotage suppose une veille régulière de la réglementation. Dans le cas contraire, les amendes peuvent s’avérer très élevées. C’est un point crucial à mettre sous contrôle au niveau de l’analyse des risques.

3 – Une sécurisation insuffisante : un des problèmes en data quality

Si vos données ne sont pas correctement sécurisées, elles manquent clairement de qualité. C’est le cas pour les entreprises qui vivent des attaques du type cybersécurité. Attention, inversement, la sécurisation ne doit pas conduire à une impossibilité d’y accéder !

3.1 – Une qualité de données insuffisante du fait du non-respect de la confidentialité

Disposer d’un datawarehouse sécurisé et unique c’est bien. Toutefois, si la gestion des droits d’accès s’avère trop légère, voire inexistante, c’est le risque de laisser l’accès à des données parfois confidentielles. Nous avons rencontré par exemple un SIRH pour lequel les verrous avaient temporairement disparu. Avec la BI, tout contrôleur de gestion du groupe pouvait consulter l’ensemble des données de paie de toutes les entités et services.

3.2 – Une accessibilité aux données insuffisante

Inversement, une data inaccessible pour les utilisateurs qui en ont besoin manque de qualité. C’est le risque que les personnes non autorisées détournent les logins et mots de passe d’autres membres de l’équipe par exemple. Parfois, cette situation peut conduire à recréer des bases de données manuelles sur tableur. Les équipes extraient elles-mêmes les informations du système informatique, sans utiliser le datawarehouse.

3.3 – Absence de gestion des doublons

Parmi les erreurs fréquentes en termes de sécurité des données, nous pouvons classer aussi les doublons. L’organisation de la data dans l’entreprise doit fonctionner sur le principe de l’unicité. Si les applications autorisent la génération de doublons, c’est un premier signe d’une qualité défaillante. Ces contrôles s’opèrent plutôt à la source, à la création de l’information, commande, facture, etc. Toutefois, les outils comme la business intelligence doivent aussi vous aider à vérifier ce point.

3.4 – Le non-respect de la RGPD

Négliger la conformité à la RGPD met en péril la qualité des données. Une gestion inadéquate des données personnelles, comme le non-respect du consentement ou la collecte excessive, peut entraîner des analyses faussées et des risques juridiques. Utiliser des outils conformes à la RGPD améliore la qualité des données en garantissant leur pertinence et leur sécurité, tout en évitant des sanctions potentiellement lourdes.

4 – Un contrôle interne déficient qui génère un besoin de nettoyage fort de la data

Tout bon processus de data quality comprend des traitements périodiques de nettoyage des données afin de ne pas accumuler des erreurs. Toutefois, nous pensons que la pratique qui consiste à passer trop de temps à « cruncher la data » est éradicable. En effet, la mise en place de nombreuses actions en amont permet de fiabiliser les données de façon plus efficace et moins énergivore. Insérez-les dans un contrôle interne de qualité.

Voici ce qui peut entraîner trop de nettoyage de la data après la collecte des données :

  • des workflows insuffisamment sécurisés dans les applications ou qui omettent des étapes ou contrôles ;
  • des procédures ou process méconnus ou mal expliqués aux utilisateurs qui parviennent à trouver une solution à leur problème en opérant différemment ;
  • des systèmes informatiques trop ouverts et qui laissent trop de liberté ou d’initiative aux équipes, notamment au niveau des référentiels.

5 – Un manque de cohérence et d’uniformisation des données entre les entités du groupe

Enfin, la donnée peut vous sembler de qualité en apparence. Mais quand vient l’heure de consolider les informations, rien ne va plus.

5.1 – Un sens de la donnée qui diffère d’une société à l’autre

Quelles sont les pratiques comptables ou quels process métier utilisent vos équipes derrière chacun des indicateurs de performance utilisés ? Même si le plan de comptes s’avère unique dans tout le groupe, rien ne garantit que la compréhension de ce qui se comptabilise dans chaque compte soit identique.

Les échanges périodiques sur le terrain, dans chaque filiale, aident notamment à identifier ces dysfonctionnements. Parfois, ils conduisent même à compléter les procédures groupe ou le modèle de reporting afin d’intégrer des particularités réellement différenciantes. 

5.2 – Des datawarehouses qui se superposent

Cette cohérence insuffisante des données intervient notamment lorsque le groupe doit consolider des informations issues de plusieurs entrepôts de données. Au gré des rachats de sociétés par exemple, l’entreprise vit parfois des années durant avec cette couche de complexité. Lorsque les exigences métier empêchent de tout consolider directement dans un seul entrepôt, la gouvernance de la data doit redoubler d’efforts pour proposer des données de qualité.

5.3 – Des outils BI mal maîtrisés par les utilisateurs

Enfin, le manque de cohérence vient parfois non pas de la donnée, mais de son exploitation incorrecte. C’est le cas notamment quand vos équipes disposent d’outils BI qu’elles ne maîtrisent pas réellement. La tentation peut surgir de travailler sans l’informatique décisionnelle, quitte à établir des reportings basés sur des données erronées.

À l’heure où de nombreux outils fonctionnent en mode self-service, la BI devient pourtant accessible au plus grand nombre. C’est aux managers d’identifier les besoins sur ce plan, afin d’améliorer la formation de leurs collaborateurs.

La qualité des données n’est pas une option. Elle exige d’adopter les bons outils et la bonne organisation ainsi que de disposer des compétences adaptées. À l’heure où le volume de la data ne cesse d’exploser et que le temps pour décider se réduit toujours, le DAF peine parfois à remplir sa mission de business partner. Chez Optimio, nous vous accompagnons dans la transformation digitale de vos entreprises. Managers de transition auprès d’ETI ou de grands groupes, nos consultants interviennent chez vous en 48 heures.


🔎 Complétez votre lecture avec les articles suivant :