Résumé
Découvrez les propriétés des documents PDF et comprenez les difficultés lors de l'exportation de fichiers de ce type.
Résolution
Non, MindBridge ne peut pas analyser les documents PDF dans la majorité des cas.
Lors de l'extraction de données à partir de PGIs, recherchez des options de menu telles que "Enregistrer sous" ou "Exporter" et sélectionnez un format de fichier courant, tel que .xlsx, .csv, .dbf, ou délimité.
Alternativement, vous pouvez utiliser n'importe quel format de base de données (SQL, MySQL, AccessDB) ou format structuré (XML, GDPdU, XAF, XBRL).
Cause principale
Les PDFs ont été initialement conçus comme un moyen de présenter des documents, souvent pour l'impression et l'affichage d'informations dans un format lisible par l'homme. En conséquence, les données dans un document PDF ne sont souvent pas dans un format lisible par une machine.
Même si elles s'intègrent parfaitement dans une table de rangées et de colonnes, il n'y a aucune garantie que les données sous-jacentes puissent être lues par une machine.
Il existe de nombreux outils de conversion et bibliothèques disponibles, cependant, selon l'ensemble de données le processus de conversion pourrait entraîner des problèmes, y compris des caractères ou des mots manquants, des colonnes mal alignées, etc.
Autre chose en tête ? Discutez avec nous ou soumettez une demande pour obtenir de l'aide supplémentaire.