Avez-vous des questions? Nous avons des réponses.

Validation des données : Aperçu

  • Mise à jour

Sommaire

L’étape de validation des données vous fournit des informations de haut niveau pour vous aider à décider si vous devez ou non poursuivre le processus d’importation.

Découvrez les différents contrôles de validation des données et comment résoudre les problèmes.

Si les données apparaissent dans un format regroupé, MindBridge ne pourra pas les analyser. Sélectionnez Format data pour formater automatiquement les données dans un format non groupé, puis procédez au processus d’importation. 

Remarque : Si le fichier contient plusieurs feuilles de calcul, MindBridge n’analysera que les données de la première feuille du fichier. Déplacez toutes les données que vous voulez analyser sur la première feuille de votre fichier, puis réimportez le fichier.

Détails du fichier

Ces détails du fichier de haut niveau peuvent vous aider à vous assurer que les données importées répondent à vos attentes en un coup d’œil.

  • Type : Affiche le type de fichier que vous avez importé, comme le grand livre général ou les comptes fournisseurs.
  • Nom : Affiche le nom du fichier que vous avez importé.
  • Nombre total de colonnes : Affiche le nombre total de colonnes détectées dans les données.
  • Nombre de lignes : Affiche le nombre total de lignes détectées dans les données.
  • Nombre de colonnes numériques : Affiche le nombre de colonnes qui ne contiennent que des données numériques.
  • Nombre de colonnes de date : Affiche le nombre de colonnes qui contiennent des dates.
  • Nombre de colonnes de texte : Affiche le nombre de colonnes qui contiennent du texte, qui peut inclure une combinaison de lettres, de chiffres et de symboles.
  • Délimiteur : Affiche le caractère, s’il existe, utilisé pour indiquer le début et la fin des colonnes dans l’ensemble de données.

Modifier le délimiteur

  1. Sélectionnez Modifier pour mettre à jour le délimiteur.
    Une fenêtre contextuelle apparaît.
  2. Utilisez le menu pour sélectionner le délimiteur que MindBridge doit rechercher ou entrez un délimiteur personnalisé dans le champ de texte.
    Utilisez la section Aperçu des colonnes de données pour vous assurer que les données sont lues correctement.
  3. Lorsque vous êtes satisfait, confirmez le changement.
    Le fichier importé est automatiquement validé de nouveau.


Vérifications de l’intégrité

Ces vérifications comprennent des informations détaillées sur chaque colonne au sein des données. Elles peuvent indiquer des problèmes avec le fichier, mais ne vous empêcheront pas de poursuivre le processus d’importation.

Ce que MindBridge recherche

Pourquoi?

La présence de colonnes numériques.

Les données doivent contenir au moins une colonne avec des valeurs numériques, sinon MindBridge n’aura pas assez de données pour effectuer une analyse.

Renseignez-vous sur les colonnes numériques.

Si le fichier contient plusieurs feuilles.

MindBridge n’analysera que les données de la première feuille de calcul du fichier. Consolidez les données pertinentes dans la première feuille, puis réimportez les données.

Si vous avez besoin d’aide pour faire figurer les données pertinentes sur la première feuille de calcul du fichier, renseignez-vous sur la soumission d’une demande de formatage de données.

Un nombre incohérent de colonnes sur les lignes.

Si 700 lignes ont 6 colonnes, et qu’une ligne a 5 colonnes, cela peut indiquer des informations manquantes ou erronées dans les données.

Renseignez-vous sur les incohérences de colonnes.

La présence de cellules anormalement grandes.

Cela peut indiquer des données erronées, des cellules fusionnées ou un échappement incorrect.

Renseignez-vous sur les tailles de cellule anormalement grandes.

Si une colonne contient plus de 50 % de cellules vides.

Cela pourrait indiquer qu’il manque des données dans le fichier.

La présence de valeurs NUL dans les données.

MindBridge est incapable d’analyser les cellules qui contiennent le mot « NUL » au lieu d’une valeur.

Supprimez le mot « NUL » des données, ou remplacez-le par les données appropriées.

Si les valeurs sont exprimées en notations scientifiques.

Les notations scientifiques apparaissent souvent sous la forme d’un nombre inférieur à 10 avec 2 décimales et une puissance de 10, de sorte que le calcul peut être moins précis que les données réelles.

Par exemple, la notation scientifique de 4,354,765,455 est 4,35E9. MindBridge a calculé que cela correspond à 4,35 x 10^9 = 4 350 000, ce qui est beaucoup moins que la valeur originale.

MindBridge peut lire les notations scientifiques qui apparaissent dans les colonnes monétaires des fichiers Excel et .CSV.

Dans Excel, les notations scientifiques apparaissent pour des raisons de présentation. Cela signifie qu’Excel traite les notations scientifiques présentes dans les colonnes monétaires* comme des chiffres.

Dans les fichiers .CSV, les notations scientifiques sont considérées comme présentées, quelle que soit la colonne dans laquelle elles apparaissent. Cela signifie que bien que MindBridge puisse les ingérer sans problème, lorsqu’ils sont présents dans un fichier .CSV, cet avertissement de validation apparaît.

*Remarque : Dans Excel, les notations scientifiques se trouvant dans des colonnes non numériques ne sont pas lisibles par MindBridge.

La présence de caractères spéciaux.

MindBridge ne peut pas analyser certains caractères spéciaux, notamment les jeux de caractères étendus (tels que les symboles de droits d’auteur), les caractères non imprimables et de contrôle (tels que les marques de formatage), et les caractères ne faisant pas partie de l’alphabet anglais moderne.

Formats de date incohérents ou non pris en charge.

Les dates figurant dans la même colonne doivent être formatées de manière cohérente et correcte.

Découvrez les formats de date pris en charge.

 


Aperçu de la colonne

Ces statistiques peuvent vous aider à vérifier vos attentes en un clin d’œil et éventuellement à trouver immédiatement des données anormales.

Nom de la colonne

Description et valeur

Nom

L’en-tête de colonne tel qu’il apparaît dans le fichier original.

Reportez-vous à cela lorsque vous visualisez les statistiques de chaque ligne.

Type de données

Indique le type de données détectées dans chaque colonne du fichier d’origine. Il peut s’agir :

  • Des dates (comme le 19/01/2020)
  • Des valeurs numériques (chiffres seulement)
  • Du texte (une combinaison de lettres, de chiffres et de caractères spéciaux)

Certaines colonnes doivent avoir certains types de données. Par exemple, si MindBridge détecte du texte dans la colonne « Date de saisie », cela peut indiquer des données erronées.

Valeur inférieure

La valeur numérique minimale présente dans une cellule de chaque colonne.

Si la valeur se situe en dehors de l’étendue attendue, cela peut être le signe de données anormales.

Valeur supérieure

La valeur numérique maximale présente dans une cellule de chaque colonne.

Si la valeur se situe en dehors de l’étendue attendue, cela peut être le signe de données anormales.

Nbre de valeurs uniques

Une estimation du nombre de valeurs uniques dans chaque colonne.

Certaines colonnes doivent avoir certaines valeurs. Par exemple, si MindBridge détecte que la colonne « Date de saisie » a 365 valeurs uniques, mais que la colonne « Date de la transaction » en a 400, cela peut indiquer des données supplémentaires hors période.

Somme

Le montant total, résultant de l’addition de toutes les valeurs numériques dans chaque colonne.

Reportez-vous à ce document pour vérifier si les débits et les crédits s’équilibrent.

Nombre minimal de caractères

Le nombre minimal de caractères présents dans une cellule de chaque colonne.

Référez-vous à cette colonne pour vérifier vos attentes. Par exemple, si MindBridge détecte une cellule avec seulement 2 caractères dans la colonne « Débit », cela peut indiquer des données erronées ou manquantes.

Nombre maximal de caractères

Le nombre maximal de caractères présents dans une cellule de chaque colonne.

Référez-vous à cette colonne pour vérifier vos attentes. Par exemple, si MindBridge détecte une cellule contenant 10 000 caractères dans la colonne « Débit », cela peut indiquer des données erronées ou un échappement incorrect.

Nbre de cellules vides

Le nombre de cellules vides qui apparaissent dans chaque colonne.

Si vous remarquez qu’une colonne obligatoire, comme Débit, contient des cellules vides, cela peut être le signe de données manquantes.

 


Exemple

General_ledger_analysis_-_Data_Validation.png


Avez-vous autre chose en tête?

Rendez-vous dans la communauté avec vos réflexions et vos questions! Vous pouvez également parler en direct avec nous ou soumettre une demande d’aide supplémentaire.


Articles connexes

Cet article vous a-t-il été utile?