Avez-vous des questions? Nous avons des réponses.

Validation des données : Aperçu

  • Mise à jour

Résumé

La validation des données de l'étape du processus d'importation de fichier fournit un aperçu du contenu du fichier et des détails de haut niveau sur la qualité des données. Les différentes sections de cette étape peuvent vous aider à déterminer s'il faut continuer l'importation ou réévaluer le fichier pour en vérifier l'exactitude et l'exhaustivité.

Remarque : Si les données apparaissent dans un format regroupé, MindBridge ne pourra pas les analyser. Sélectionnez Formater les données pour convertir automatiquement les données en un format non regroupé, puis continuez avec le processus d'importation.
Remarque : MindBridge analysera uniquement les données de la première feuille du fichier. Si vous avez des données pertinentes sur plusieurs feuilles, utilisez les outils diviser et fusionner dans le gestionnaire de fichiers ( Icône du gestionnaire de fichiers ) pour extraire et combiner les feuilles sans affecter le fichier original.

Détails du fichier

Ce volet fournit des informations sur les attributs clés qui peuvent vous aider à vérifier si les données importées correspondent à vos attentes.

  • Période actuelle (ou période précédente) : La date de début et la date de fin pour la période donnée.
  • Type : Le type de fichier prévu (par exemple, Grand livre, ou Solde d'ouverture, etc.), basé sur l'emplacement dans lequel le fichier a été importé sur la page des données.
  • Nom : Le nom du fichier qui a été importé.
  • Nombre total de colonnes : Le nombre total de colonnes détectées dans le fichier.
  • Nombre de rangées : Le nombre total de rangées détectées dans le fichier.
  • Nombre de colonnes numériques : Le nombre total de colonnes contenant uniquement des données numériques.
  • Nombre de colonnes de dates : Le nombre total de colonnes contenant des dates.
  • Nombre de colonnes de texte : Le nombre total de colonnes contenant du texte, qui peut inclure une combinaison de lettres, de chiffres et de symboles.
  • Délimiteur : Affiche le caractère utilisé pour indiquer où commencent et se terminent les colonnes dans l'ensemble de données. Vous permet également de modifier le délimiteur.

Capture d'écran mettant en évidence le volet des détails du fichier

Modifier le délimiteur

  1. Sélectionnez Modifier pour mettre à jour le délimiteur. Une fenêtre de sélection apparaîtra.
  2. Utilisez le menu pour sélectionner le délimiteur que MindBridge doit rechercher ou entrez un délimiteur personnalisé dans le champ de texte.
    Utilisez la section Aperçu des colonnes de données pour vous assurer que les données sont correctement lues.
  3. Lorsque vous êtes satisfait, Confirmez le changement.
    Le fichier en cours d'importation est automatiquement re-validé.


Vérifications de l'intégrité

Ces vérifications incluent des informations sur différents aspects de la qualité des données. Elles peuvent indiquer des problèmes avec le fichier, mais ne vous empêcheront pas de continuer le processus d'importation.

Capture d'écran mettant en évidence le volet des vérifications de l'intégrité

Ce que recherche MindBridge

Pourquoi ?

La présence de colonnes numériques.

Les données doivent contenir au moins 1 colonne avec uniquement des valeurs numériques, sinon MindBridge n'aura pas assez de données pour effectuer une analyse.

Remarque : Si MindBridge détecte un caractère non numérique dans une colonne numérique, vous ne pourrez pas continuer. Pour résoudre le problème, supprimez les caractères non numériques de la colonne numérique et réimportez le fichier.

En savoir plus sur les colonnes numériques

Si le fichier contient plusieurs feuilles.

MindBridge analysera uniquement les données de la première feuille du fichier. Consolidez les données pertinentes dans la première feuille, puis réimportez les données.

Si vous avez besoin d'aide pour obtenir les données pertinentes sur la première feuille du fichier, en savoir plus sur la soumission d'une demande de formatage des données.

Un nombre de colonnes incohérent entre les rangées.

Si 700 rangées ont 6 colonnes, et 1 rangée a 5 colonnes, cela pourrait indiquer des informations manquantes ou erronées dans les données.

En savoir plus sur l'incohérence des colonnes

La présence de cellules anormalement grandes.

Cela pourrait indiquer des données erronées, des cellules fusionnées ou une évasion incorrecte.

En savoir plus sur les cellules anormalement grandes

Si des colonnes contiennent plus de 50 % de cellules vides.

Cela pourrait indiquer qu'il manque des données dans le fichier.

La présence de valeurs NULL dans les données.

MindBridge ne peut pas analyser les cellules contenant le mot "NULL" au lieu d'une valeur.

Supprimez le mot "NULL" des données, ou remplacez-le par les données appropriées.

Si les valeurs sont exprimées en notations scientifiques.

Les notations scientifiques apparaissent souvent comme un nombre inférieur à 10 avec 2 décimales et une puissance de 10, de sorte que le calcul peut être moins précis que les données réelles.

Par exemple, la notation scientifique de 4,354,765,455 est 4.35E9. MindBridge calculerait cela comme 4.35 x 10^9 = 4,350,000, ce qui est bien inférieur à la valeur originale.

MindBridge peut lire les notations scientifiques qui apparaissent dans les colonnes monétaires dans les fichiers Excel et .CSV.

Dans Excel, les notations scientifiques apparaissent à des fins de présentation. Cela signifie qu'Excel traite les notations scientifiques trouvées dans les colonnes monétaires* comme des chiffres.

Dans les fichiers .CSV, les notations scientifiques sont prises telles qu'elles sont présentées, quel que soit la colonne dans laquelle elles apparaissent. Cela signifie que bien que MindBridge puisse les ingérer sans problème, lorsqu'elles sont présentes dans un fichier .CSV, cet avertissement de validation apparaît.

*Remarque : Dans Excel, les notations scientifiques trouvées dans les colonnes non numériques ne sont pas lisibles par MindBridge.

La présence de caractères spéciaux.

MindBridge ne peut pas analyser certains caractères spéciaux, y compris les jeux de caractères étendus (tels que les symboles de copyright), les caractères non imprimables et les caractères de contrôle (tels que les marques de formatage).

Formats de date incohérents, ambigus ou non pris en charge.

Les dates apparaissant dans la même colonne doivent être formatées de manière cohérente et correcte.

En savoir plus sur les formats de date pris en charge

 


Aperçu des colonnes

Ces statistiques peuvent aider à vérifier vos attentes en un coup d'œil, et peuvent vous aider à trouver des données anormales immédiatement.

Utilisez l'icône chevron ( Icône d'extension du chevron ) pour développer la section et voir un aperçu de vos colonnes.

GIF montrant comment accéder à l'aperçu des colonnes.gif

Nom de la colonne

Description et valeur

Nom

L'en-tête de colonne tel qu'il apparaît dans le fichier original.

Référez-vous à cela lorsque vous consultez les statistiques dans chaque rangée.

Type de données

Indique le type de données détecté dans chaque colonne du fichier original. Ceux-ci peuvent être :

  • Dates (comme 01/19/2020)
  • Numérique (uniquement des chiffres)
  • Texte (une combinaison de lettres, de chiffres et de caractères spéciaux)

Certaines colonnes sont censées avoir certains types de données. Par exemple, si MindBridge détecte du texte dans la colonne "Date d'entrée", cela peut indiquer des données erronées.

Valeur la plus basse

La valeur numérique la plus basse trouvée dans une cellule de chaque colonne.

Si la valeur se situe en dehors de la plage attendue, cela peut indiquer des données anormales.

Valeur la plus élevée

La valeur numérique la plus élevée trouvée dans une cellule de chaque colonne.

Si la valeur se situe en dehors de la plage attendue, cela peut indiquer des données anormales.

# de valeurs uniques

Une estimation du nombre de valeurs uniques dans chaque colonne.

Certaines colonnes sont censées avoir certaines valeurs. Par exemple, si MindBridge détecte que la "Date d'entrée" a 365 valeurs uniques, mais que la colonne "Date d'effet" en a 400, cela peut indiquer des données

Somme

Le montant total, résultant de la sommation de toutes les valeurs numériques dans chaque colonne.

Référez-vous à cela pour vérifier si les débits et crédits s'équilibrent.

Nombre le plus bas de caractères

Le nombre le plus bas de caractères trouvés dans une cellule de chaque colonne.

Référez-vous à cette colonne pour vérifier vos attentes. Par exemple, si MindBridge détecte une cellule avec seulement 2 caractères dans la colonne "Débit", cela peut indiquer des données erronées ou manquantes.

Nombre le plus élevé de caractères

Le nombre le plus élevé de caractères trouvés dans une cellule de chaque colonne.

Référez-vous à cette colonne pour vérifier vos attentes. Par exemple, si MindBridge détecte une cellule avec 10 000 caractères dans la colonne "Débit", cela peut indiquer des données erronées ou une mauvaise évasion.

Nombre de cellules vides

Le nombre de cellules vides qui apparaissent dans chaque colonne.

Si vous remarquez qu'une colonne requise comme Débit contient des cellules vides, cela peut indiquer des données manquantes.

 


Autre chose en tête? Discutez avec nous ou soumettez une demande pour obtenir de l'aide supplémentaire.


Articles connexes

Cet article vous a-t-il été utile?