Fragen? Wir haben die Antworten.

Datenvalidierung: Übersicht

  • Aktualisiert

Zusammenfassung

Der Datenvalidierung Schritt des Datei-Importprozesses bietet einen Überblick über den Dateiinhalt und hochrangige Details zur Datenqualität. Die verschiedenen Abschnitte in diesem Schritt können Ihnen helfen zu entscheiden, ob Sie mit dem Import fortfahren oder die Datei auf Genauigkeit und Vollständigkeit neu bewerten sollten.

Hinweis: Wenn die Daten in einem gruppierten Format vorliegen, kann MindBridge sie nicht analysieren. Wählen Sie Daten formatieren, um die Daten automatisch in ein ungrouped format zu konvertieren, und fahren Sie dann mit dem Importprozess fort.
Hinweis: MindBridge analysiert nur Daten auf dem ersten Arbeitsblatt der Datei. Wenn Sie relevante Daten auf mehreren Arbeitsblättern haben, verwenden Sie die aufteilen und fusion Werkzeuge im Dateimanager ( File manager icon ), um Arbeitsblätter zu extrahieren und zu kombinieren, ohne die Originaldatei zu beeinflussen.

Dateidetails

Dieses Fenster bietet Informationen zu wichtigen Attributen, die Ihnen helfen können zu überprüfen, ob die importierten Daten Ihren Erwartungen entsprechen.

  • Aktueller Zeitraum (oder Vorheriger Zeitraum): Das Startdatum und Enddatum für den gegebenen Zeitraum.
  • Typ: Der beabsichtigte Dateityp (z.B. Hauptbuch oder Eröffnungssaldo usw.), basierend auf dem Slot, in den die Datei auf der Daten Seite importiert wurde.
  • Name: Der Name der importierten Datei.
  • Gesamtzahl der Spalten: Die Gesamtanzahl der in der Datei erkannten Spalten.
  • Anzahl der Zeilen: Die Gesamtanzahl der in der Datei erkannten Zeilen.
  • Anzahl der numerischen Spalten: Die Gesamtanzahl der Spalten, die nur numerische Daten enthalten.
  • Anzahl der Datumsspalten: Die Gesamtanzahl der Spalten, die Datumsangaben enthalten.
  • Anzahl der Textspalten: Die Gesamtanzahl der Spalten, die Text enthalten, der eine Kombination aus Buchstaben, Zahlen und Symbolen sein kann.
  • Trennzeichen: Zeigt das Zeichen an, das verwendet wird, um anzuzeigen, wo Spalten im gesamten Datensatz beginnen und enden. Ermöglicht auch das Bearbeiten des Trennzeichens.

Screenshot highlighting the file details pane

Trennzeichen bearbeiten

  1. Wählen Sie Bearbeiten, um das Trennzeichen zu aktualisieren. Ein Auswahlfenster wird angezeigt.
  2. Verwenden Sie das Menü, um das Trennzeichen auszuwählen, nach dem MindBridge suchen soll, oder geben Sie ein benutzerdefiniertes Trennzeichen im Textfeld ein.
    Verwenden Sie den Abschnitt Datenvorschau, um sicherzustellen, dass die Daten korrekt gelesen werden.
  3. Wenn Sie zufrieden sind, Bestätigen Sie die Änderung.
    Die importierte Datei wird automatisch erneut validiert.


Integritätsprüfungen

Diese Prüfungen enthalten Informationen zu verschiedenen Aspekten der Datenqualität. Sie können auf Probleme mit der Datei hinweisen, verhindern jedoch nicht, dass Sie den Importprozess fortsetzen.

Screenshot highlighting the integrity checks pane

Wonach MindBridge sucht

Warum?

Das Vorhandensein numerischer Spalten.

Die Daten müssen mindestens 1 Spalte mit nur numerischen Werten enthalten, sonst hat MindBridge nicht genügend Daten, um eine Analyse durchzuführen.

Hinweis: Wenn MindBridge ein nicht-numerisches Zeichen in einer numerischen Spalte erkennt, können Sie nicht fortfahren. Um das Problem zu lösen, entfernen Sie nicht-numerische Zeichen aus der numerischen Spalte und importieren Sie die Datei erneut.

Erfahren Sie mehr über numerische Spalten

Ob die Datei mehrere Arbeitsblätter enthält.

MindBridge analysiert nur Daten aus dem ersten Arbeitsblatt der Datei. Konsolidieren Sie die relevanten Daten im ersten Arbeitsblatt und importieren Sie die Daten erneut.

Wenn Sie Hilfe benötigen, um die relevanten Daten auf das erste Arbeitsblatt der Datei zu bringen, erfahren Sie mehr über das Einreichen einer Datenformatierungsanfrage.

Eine inkonsistente Anzahl von Spalten über die Zeilen hinweg.

Wenn 700 Zeilen 6 Spalten haben und 1 Zeile 5 Spalten hat, könnte dies auf fehlende oder fehlerhafte Informationen in den Daten hinweisen.

Erfahren Sie mehr über Spalteninkonsistenz

Das Vorhandensein ungewöhnlich großer Zellen.

Dies könnte auf fehlerhafte Daten, zusammengeführte Zellen oder unsachgemäße Maskierung hinweisen.

Erfahren Sie mehr über ungewöhnlich große Zellen

Ob Spalten über 50% leere Zellen enthalten.

Dies könnte darauf hinweisen, dass Daten in der Datei fehlen.

Das Vorhandensein von NULL-Werten in den Daten.

MindBridge kann Zellen, die das Wort "NULL" anstelle eines Wertes enthalten, nicht analysieren.

Entfernen Sie das Wort „NULL“ aus den Daten oder ersetzen Sie es durch die entsprechenden Daten.

Ob Werte in wissenschaftlichen Notationen ausgedrückt werden.

Wissenschaftliche Notationen erscheinen oft als eine Zahl unter 10 mit 2 Dezimalstellen und einer Potenz von 10, sodass die Berechnung weniger präzise sein kann als die tatsächlichen Daten.

Zum Beispiel ist die wissenschaftliche Notation von 4.354.765.455 4.35E9. MindBridge würde dies als 4.35 x 10^9 = 4.350.000 berechnen, was viel weniger als der ursprüngliche Wert ist.

MindBridge kann wissenschaftliche Notationen, die in monetären Spalten sowohl in Excel- als auch in .CSV-Dateien erscheinen, lesen.

In Excel erscheinen wissenschaftliche Notationen zu Präsentationszwecken. Das bedeutet, dass Excel wissenschaftliche Notationen, die in monetären Spalten* gefunden werden, als Zahlen behandelt.

In .CSV-Dateien werden wissenschaftliche Notationen so genommen, wie sie präsentiert werden, unabhängig davon, in welcher Spalte sie erscheinen. Das bedeutet, dass MindBridge sie zwar ohne Probleme einlesen kann, aber wenn sie in einer .CSV-Datei vorhanden sind, erscheint diese Validierungswarnung.

*Hinweis: In Excel sind wissenschaftliche Notationen, die in nicht-numerischen Spalten gefunden werden, für MindBridge nicht lesbar.

Das Vorhandensein von Sonderzeichen.

MindBridge kann einige Sonderzeichen nicht analysieren, einschließlich erweiterter Zeichensätze (wie Copyright-Symbole), nicht druckbarer und Steuerzeichen (wie Formatierungsmarken).

Inkonsistente, mehrdeutige oder nicht unterstützte Datumsformate.

Datumsangaben, die in derselben Spalte erscheinen, sollten konsistent und korrekt formatiert sein.

Erfahren Sie mehr über unterstützte Datumsformate

 


Spaltenvorschau

Diese Statistiken können Ihnen helfen, Ihre Erwartungen auf einen Blick zu überprüfen und Ihnen möglicherweise sofort bei der Erkennung anomaler Daten zu helfen.

Verwenden Sie das Chevron Symbol ( Expand chevron icon ), um den Abschnitt zu erweitern und eine Vorschau Ihrer Spalten anzuzeigen.

GIF showing how to access the column preview.gif

Spaltenname

Beschreibung und Wert

Name

Der Spaltenkopf, wie er in der Originaldatei erscheint.

Beziehen Sie sich darauf, wenn Sie die Statistiken in jeder Zeile anzeigen.

Datentyp

Gibt den Datentyp an, der in jeder Spalte der Originaldatei erkannt wurde. Diese können sein:

  • Datumsangaben (wie 01/19/2020)
  • Numerisch (nur Zahlen)
  • Text (eine Kombination aus Buchstaben, Zahlen und Sonderzeichen)

Einige Spalten werden erwartet, bestimmte Datentypen zu haben. Zum Beispiel, wenn MindBridge Text in der "Erfassungsdatum" Spalte erkennt, könnte dies auf fehlerhafte Daten hinweisen.

Niedrigster Wert

Der niedrigste numerische Wert, der in einer Zelle innerhalb jeder Spalte gefunden wurde.

Wenn der Wert außerhalb des erwarteten Bereichs liegt, könnte dies auf anomale Daten hinweisen.

Höchster Wert

Der höchste numerische Wert, der in einer Zelle innerhalb jeder Spalte gefunden wurde.

Wenn der Wert außerhalb des erwarteten Bereichs liegt, kann dies auf anomale Daten hinweisen.

# der eindeutigen Werte

Eine Schätzung der Anzahl eindeutiger Werte in jeder Spalte.

Einige Spalten sollen bestimmte Werte enthalten. Wenn MindBridge beispielsweise erkennt, dass das "Erfassungsdatum" 365 eindeutige Werte hat, die Spalte "Buchungsdatum" jedoch 400, kann dies auf zusätzliche Daten außerhalb des Zeitraums hinweisen.

Summe

Der Gesamtbetrag, der sich aus der Summierung aller numerischen Werte in jeder Spalte ergibt.

Verweisen Sie darauf, um zu überprüfen, ob Lastschriften und Gutschriften ausgeglichen sind.

Niedrigste Anzahl von Zeichen

Die niedrigste Anzahl von Zeichen, die in einer Zelle innerhalb jeder Spalte gefunden wurden.

Verweisen Sie auf diese Spalte, um Ihre Erwartungen zu überprüfen. Wenn MindBridge beispielsweise eine Zelle mit nur 2 Zeichen in der Spalte "Soll" erkennt, kann dies auf fehlerhafte oder fehlende Daten hinweisen.

Höchste Anzahl von Zeichen

Die höchste Anzahl von Zeichen, die in einer Zelle innerhalb jeder Spalte gefunden wurden.

Verweisen Sie auf diese Spalte, um Ihre Erwartungen zu überprüfen. Wenn MindBridge beispielsweise eine Zelle mit 10.000 Zeichen in der Spalte "Soll" erkennt, kann dies auf fehlerhafte Daten oder unsachgemäßes Escaping hinweisen.

Anzahl der leeren Zellen

Die Anzahl der leeren Zellen, die in jeder Spalte erscheinen.

Wenn Sie feststellen, dass eine erforderliche Spalte wie Soll leere Zellen enthält, kann dies auf fehlende Daten hinweisen.

 


Haben Sie noch etwas auf dem Herzen? Chatten Sie mit uns oder senden Sie eine Anfrage für weitere Unterstützung.


Verwandte Artikel

War dieser Beitrag hilfreich?