Sommaire
Apprenez quelques-uns des concepts clés qui permettent de formater facilement un fichier.
Il décrira également les caractéristiques des fichiers qui ne peuvent pas être formatés facilement (dans ce cas, nous vous recommandons de vous procurer un meilleur fichier source pour travailler).
Conditions requises pour qu’un fichier soit formatable
Certains des fichiers de vos clients ne sont peut-être pas dans un format que MindBridge peut ingérer, et il peut être difficile de formater le fichier vous-même. Notre équipe de données peut vous aider à formater des fichiers compliqués, mais seulement s’il existe un moyen d’identifier systématiquement chacun des champs champ requis.
Les données de chaque champ obligatoire doivent satisfaire à certains des critères suivants :
-
Suit un modèle
- Par exemple, le numéro de compte et la description du compte se trouvent dans la même colonne, mais un délimiteur cohérent les sépare, ou; les numéros de compte sont tous alphanumériques sans espace, ou; tous les numéros de compte ont une longueur spécifique.
-
Est dans une seule colonne
- C’est le format idéal et ce sera le résultat final.
-
Si les données ne sont pas dans une seule colonne, elles doivent être dans l’une d’un petit nombre de colonnes.
- Cela est gérable si, par exemple, les débits se trouvent dans les colonnes F ou G, et qu’aucun autre champ ne se trouve dans les colonnes F ou G, ou si les débits peuvent se trouver dans les colonnes F ou G, ainsi qu’un mémo, mais qu’un débit est toujours entièrement numérique alors qu’un mémo comporte toujours des caractères non numériques. Cependant, la mise en forme de ce cas est généralement chronophage, car il faut du temps pour découvrir le motif et ensuite écrire du code pour repérer et traiter ce motif, surtout dans les gros fichiers où le motif peut changer très loin dans le temps.
-
Contient des données précises
- Si les montants sont incorrects, si certains chiffres manquent, ou s’il y a des sections manquantes, le fichier sera probablement inutilisable.
En d’autres termes, les colonnes doivent être bien définies, voire alignées, et les données doivent être correctes.
Consultez la page Exigences en matière de données pour plus de détails sur les critères qu’un fichier formaté doit remplir. S’il n’existe aucun moyen de transformer le fichier pour satisfaire à ces exigences, le fichier n’est pas formatable.
Caractéristiques des fichiers qui ne peuvent pas être formatés
-
Fichiers au format PDF ou image
- Les fichiers qui se retrouvent dans ces formats inutilisables étaient souvent des exportations initiales en PDF ou en image ou tout autre format qui n’est pas destiné à l’analyse des données, puis convertis en Excel ou en texte. C’est pourquoi nous ne prenons pas en charge les fichiers au format PDF ou image, même si vous les faites passer par un convertisseur PDF/image.
-
Cellules fusionnées
- Une caractéristique commune d’un fichier qui ne peut pas être formaté est la présence de cellules fusionnées partout dans le fichier, et pas seulement dans les en-têtes ou dans des colonnes spécifiques.
-
Colonnes excessives
- Un autre signe indiquant qu’un fichier pourrait ne pas être formattable est la présence de nombreuses colonnes, en plus des caractéristiques décrites ci-dessus (nombreuses cellules fusionnées, colonnes pas toujours alignées ou bien définies). Plus de 30 colonnes peuvent être suspectes (au-delà de la colonne AD ou plus dans Excel), et surtout plus de 50 colonnes (au-delà de la colonne AX dans Excel) deviennent très suspectes.
-
Fichiers texte à largeur fixe (parfois)
- Bien que MindBridge ne puisse pas ingérer directement des fichiers texte au format de largeur fixe, ils peuvent être formatés si chaque champ tombe toujours dans une position spécifique, par exemple, les débits sont toujours entre les positions de caractères 49 et 65 sur chaque ligne. Notre équipe de données peut également formater des fichiers texte à largeur fixe qui sont groupés, tant que les lignes de transaction satisfont toutes à la condition selon laquelle chaque champ tombe toujours dans une position spécifique, et qu’il existe un moyen (par exemple, sur la base du modèle et/ou de la longueur) d’identifier les lignes de transaction et les lignes d’en-tête avec les informations de compte qui doivent être dégroupées.
Exemple d’un fichier qui ne peut pas être formaté
Dans cet exemple, nous avons la Variation nette, le Solde d’ouverture, le Débit, le Crédit et le Solde de clôture qui apparaissent dans de nombreuses colonnes, et souvent le Débit et le Crédit sont tous deux dans une colonne :
Parfois, il y a 2 ou 3 chiffres dans une cellule – il peut s’agir de la variation nette, du solde d’ouverture et du débit.
Remarquez qu’il y a des chiffres au hasard dans différentes cellules, et que même les en-têtes peuvent se trouver dans plusieurs colonnes différentes (par exemple, Solde d’ouverture). Il n’y a pas de moyen systématique d’identifier, pour une ligne donnée, où extraire le montant du débit ou du crédit.
Avez-vous autre chose en tête? Vous pouvez également clavarder avec nous ou soumettre une demande d’aide supplémentaire.