Résumé
Découvrez certains des concepts clés qui permettent de formater facilement un fichier.
Il décrira également les caractéristiques des fichiers qui ne peuvent pas être formatés facilement (dans ce cas, nous recommandons d’utiliser un meilleur fichier source pour la tâche).
Conditions requises pour qu’un fichier puisse être formaté
Certains fichiers de vos clients peuvent ne pas être dans un format pris en charge par MindBridge, et il peut être difficile de formater le fichier vous-même. Notre équipe en charge de données peut vous aider à formater des fichiers complexes, mais uniquement s’il existe un moyen d’identifier systématiquement chacun des champs requis.
Les données de chaque champ requis doivent répondre à certaines des conditions suivantes :
-
Suit un modèle
- Par exemple, le numéro de compte et la description du compte se trouvent dans la même colonne, mais un délimiteur cohérent les sépare, ou ; les numéros de compte ont tous des caractères alphanumériques sans espaces, ou ; tous les numéros de compte ont une longueur spécifique.
-
Se trouve dans une seule colonne
- Il s’agit du format idéal qui représentera le résultat final.
-
Si les données ne se trouvent pas dans une seule colonne, elles doivent se trouver dans l'une d'un petit nombre de colonnes
- Par exemple, si les débits apparaissent dans la colonne
- Cela peut être géré si, par exemple, les débits se trouvent dans les colonnes F ou G, et aucun autre champ ne se trouve dans les colonnes F ou G, ou si les débits peuvent se trouver dans les colonnes F ou G, tout comme un mémo. Mais un débit est toujours constitué de caractères numériques, tandis qu’un mémo a toujours des caractères non numériques. Cependant, le formatage de ce cas est généralement long, car il faut du temps pour déterminer le modèle et écrire le code qui permet de le repérer et de le traiter, en particulier dans les fichiers volumineux où le modèle peut changer.
-
Contient des données précises
- Si les montants sont incorrects et si certains chiffres et certaines sections sont manquant(e)s, le fichier sera probablement inutilisable.
En d’autres termes, les colonnes doivent être bien définies, voire alignées, et les données doivent être correctes.
Consultez la page Exigences relatives aux données pour plus de détails sur les critères qu’un fichier formaté doit remplir. S’il n’existe aucun moyen de convertir le fichier pour satisfaire à ces exigences, le fichier ne peut pas être formaté.
Caractéristiques des fichiers qui ne peuvent pas être formatés
-
Fichiers PDF ou au format image
- Généralement, les fichiers qui se trouvent dans de tels formats inutilisables ont été initialement exportés au format PDF ou image, ou vers tout autre format non pris en charge par l’analyse des données, puis convertis au format Excel ou texte. C’est pourquoi nous ne prenons pas en charge les fichiers PDF ou au format image, même si vous les exécutez via un convertisseur PDF/image.
-
Cellules fusionnées
- Une caractéristique courante d’un fichier qui ne peut pas être formaté est la présence de cellules fusionnées dans l’ensemble du fichier, et pas seulement dans les en-têtes ou dans des colonnes spécifiques.
-
Nombre excessif de colonnes
- Un autre signe qu’un fichier peut ne pas être formaté est la présence de nombreuses colonnes, en plus des caractéristiques décrites ci-dessus (de nombreuses cellules fusionnées, des colonnes qui ne sont pas toujours alignées ou bien définies). Un nombre de colonnes supérieur à 30 peut être suspect (au-delà de la colonne AD dans Excel), et, en particulier, un nombre de colonnes supérieur à 50 (au-delà de la colonne AX dans Excel) devient très suspect.
-
Fichiers texte à largeur fixe (parfois)
- Bien que MindBridge ne puisse pas ingérer directement des fichiers texte à largeur fixe, ils peuvent être formatables si chaque champ se trouve toujours à une position spécifique. Par exemple, les débits se trouvent toujours entre les positions de caractères 49 et 65 sur chaque ligne. Notre équipe de données peut également formater des fichiers texte à largeur fixe qui sont regroupés, tant que les lignes de transaction satisfont toutes à la condition selon laquelle chaque champ se trouve toujours dans une position spécifique, et qu’il existe une manière (par ex., en fonction du modèle et/ou de la longueur) d’identifier les lignes de transaction et les lignes d’en-tête avec les informations de compte qui doivent être non groupées.
Exemple de fichier qui ne peut pas être formaté
Dans cet exemple, les champs Variation nette, Solde de départ, Débit, Crédit et Solde de clôture apparaissent dans de nombreuses colonnes, et souvent Débit et Crédit sont tous deux dans une seule colonne :
Une cellule peut parfoir contenir 2 ou 3 chiffres : il peut s’agir de la variation nette, du solde de départ et du débit.
Remarquez que les chiffres sont placés de manière aléatoire dans différentes cellules, et que même les en-têtes peuvent se trouver dans plusieurs colonnes différentes (par exemple, solde de départ). Il n’existe aucune manière systématique d’identifier, pour une ligne donnée, où extraire le montant du débit ou du crédit.
Quelque chose d’autre vous vient à l’esprit ?
Rejoignez la communauté pour faire part de vos réflexions et demandes de renseignements ! Vous pouvez également discuter avec nous ou soumettre une demande d’assistance supplémentaire.