Avez-vous des questions? Nous avons des réponses.

La différence entre un fichier formatable et un fichier non formatable

  • Mise à jour

Résumé

Découvrez certains des concepts clés qui permettent de formater facilement un fichier.

Il décrira également les caractéristiques des fichiers qui ne peuvent pas être formatés facilement (dans ce cas, nous recommandons d'obtenir un meilleur fichier source avec lequel travailler).


Exigences pour qu'un fichier soit formatable

Certains fichiers de vos clients peuvent ne pas être dans un format que MindBridge peut ingérer, et il peut être difficile de formater le fichier vous-même. Notre équipe de données peut vous aider à formater des fichiers compliqués, mais seulement s'il existe un moyen d'identifier systématiquement chacun des champs requis.

Les données dans chaque champ requis doivent satisfaire certaines des conditions suivantes :

  • Suit un modèle
    • Par exemple, le numéro de compte et la description du compte sont dans la même colonne, mais un délimiteur cohérent les sépare, ou; les numéros de compte sont tous alphanumériques sans espaces, ou; tous les numéros de compte ont une longueur spécifique.
  • Est dans une seule colonne
    • C'est le format idéal et sera le résultat final.
  • Si les données ne sont pas dans une seule colonne, alors être dans un petit nombre de colonnes
    • C'est gérable si, par exemple, les Dt sont dans les colonnes F ou G, et qu'aucun autre champ n'est dans les colonnes F ou G, ou les Dt peuvent être dans F ou G, et il en va de même pour une note, mais un Dt est toujours entièrement numérique tandis qu'une note a toujours des caractères non numériques. Cependant, il est généralement long de formater ce cas car il faut du temps pour comprendre le modèle, puis écrire du code pour repérer et gérer ce modèle, surtout dans les gros fichiers où le modèle peut changer très loin.
  • Contient des données précises
    • Si les montants sont incorrects, certains chiffres manquants, ou s'il manque des sections, le fichier sera probablement inutilisable.

En d'autres termes, les colonnes doivent être bien définies si elles ne sont pas alignées, et les données doivent être correctes.

Visitez la page des exigences de données pour plus de détails sur les critères qu'un fichier formaté doit remplir. S'il n'y a aucun moyen de transformer le fichier pour satisfaire ces exigences, le fichier n'est pas formatable.


Caractéristiques des fichiers qui ne peuvent pas être formatés

  • Fichiers au format PDF ou image
    • Les fichiers qui se retrouvent dans de tels formats inutilisables étaient souvent des exportations initiales vers PDF ou image ou tout format qui n'est pas destiné à l'analyse de données, puis convertis en Excel ou texte. C'est pourquoi nous ne prenons pas en charge les fichiers au format PDF ou image, même si vous les passez par un convertisseur PDF/image.
  • Cellules fusionnées
    • Une caractéristique courante d'un fichier qui ne peut pas être formaté est la présence de cellules fusionnées partout dans le fichier, et pas seulement dans les en-têtes ou dans des colonnes spécifiques.
  • Colonnes excessives
    • Un autre signe qu'un fichier pourrait ne pas être formatable est la présence de nombreuses colonnes, en plus des caractéristiques décrites ci-dessus (de nombreuses cellules fusionnées, des colonnes pas toujours alignées ou bien définies). Plus de 30 colonnes peuvent être suspectes (au-delà de la colonne AD ou environ dans Excel), et surtout plus de 50 colonnes (au-delà de la colonne AX dans Excel) deviennent très suspectes.
  • Fichiers texte à largeur fixe (parfois)
    • Bien que MindBridge ne puisse pas ingérer directement des fichiers texte à largeur fixe, ils peuvent être formatables si chaque champ se trouve toujours à une position spécifique, par exemple, les Dt sont toujours entre les positions de caractères 49 et 65 sur chaque rangée. Notre équipe de données peut également formater des fichiers texte à largeur fixe qui sont groupés, tant que les rangées de transactions satisfont toutes la condition que chaque champ se trouve toujours à une position spécifique, et qu'il existe un moyen (par exemple, basé sur le modèle et/ou la longueur) d'identifier les rangées de transactions et les rangées d'en-tête avec les informations de compte qui doivent être dégroupées.

Exemple d'un fichier qui ne peut pas être formaté

Dans cet exemple, nous avons Changement Net, Solde Initial, Débit, Crédit, et Solde Final apparaissant dans de nombreuses colonnes, et souvent Débit et Crédit sont tous deux dans une colonne :

mceclip0.png

mceclip1.png

Parfois, il y a 2 ou 3 chiffres dans une cellule — ils pourraient être Changement Net, Solde Initial, et Débit.

mceclip4.png

Remarquez comment il y a des chiffres aléatoirement dans différentes cellules, et même les en-têtes peuvent être dans de nombreuses colonnes différentes (par exemple, Solde Initial). Il n'y a aucun moyen systématique d'identifier, pour une rangée donnée, où extraire le montant du débit ou du crédit.


Autre chose en tête ? Discutez avec nous ou soumettez une demande pour obtenir de l'aide supplémentaire.

Cet article vous a-t-il été utile?