PDF-Metadaten: Was sie enthalten und wie Sie sie verwalten

Jede PDF-Datei trägt Metadaten - versteckte Informationen über das Dokument, die über den sichtbaren Inhalt hinausgehen. Dazu gehören Autorname, Erstellungsdatum, verwendete Software, Bearbeitungsverlauf und manchmal sogar GPS-Koordinaten oder Benutzerkontonamen. Während Metadaten für die Dokumentenverwaltung nützlich sind, können sie auch sensible Informationen preisgeben. Wer Dokumente teilt, ohne die Metadaten zu pruefen, riskiert unbeabsichtigte Datenlecks, die im schlimmsten Fall gegen Datenschutzgesetze wie die DSGVO verstossen koennen.

Was PDF-Metadaten umfassen

PDF-Metadaten werden an zwei Stellen gespeichert: dem Dokumentinformations-Wörterbuch und XMP-Daten (Extensible Metadata Platform). Gängige Felder sind Titel, Autor, Betreff, Schlüsselwörter, Ersteller (die Anwendung, die das Originaldokument erstellt hat), Erzeuger (die Software, die es in PDF konvertiert hat), Erstellungs- und Änderungsdatum. Manche PDFs enthalten auch benutzerdefinierte Metadaten - darunter Firmennamen, Benutzernamen, Dateipfade auf dem Computer des Autors und Template-Informationen.

PDF-Metadaten anzeigen und bearbeiten

  1. 1

    PDF-Eigenschaften öffnen

    In den meisten PDF-Readern gehen Sie zu Datei > Eigenschaften oder Dokumenteigenschaften, um grundlegende Metadaten wie Titel, Autor und Daten anzuzeigen.

  2. 2

    Auf versteckte Metadaten prüfen

    Nutzen Sie ein Metadaten-Inspektionstool, um alle Metadatenfelder aufzudecken, einschliesslich XMP-Daten und benutzerdefinierter Eigenschaften.

  3. 3

    Sensible Felder bearbeiten oder entfernen

    Nutzen Sie UnblockPDF, um Metadatenfelder vor dem Teilen zu ändern oder zu entfernen. Entfernen Sie Autorennamen, Dateipfade und andere persönlich identifizierende Informationen.

Tipps zur Metadatenverwaltung

  • Prüfen Sie Metadaten immer vor der externen Weitergabe - Autorennamen und Dateipfade können mehr preisgeben als beabsichtigt.
  • Richten Sie Dokumentvorlagen mit sauberen Metadaten ein, um das Übertragen von Informationen aus früheren Projekten zu vermeiden.
  • Nutzen Sie Metadaten strategisch für die interne Dokumentenverwaltung - Schlüsselwörter und Betreffs helfen bei Suche und Organisation.
  • Für DSGVO-Konformität entfernen Sie persönliche Metadaten aus jeder PDF, die öffentlich oder an Dritte weitergegeben wird.

XMP-Metadaten: Der moderne Standard

XMP (Extensible Metadata Platform) ist Adobes moderner Metadatenstandard, der in PDF-Dateien als eingebetteter XML-Strom gespeichert wird. Im Gegensatz zum aelteren Dokumentinformations-Woerterbuch bietet XMP eine erweiterbare Struktur mit definierten Schemata. Dublin-Core-Metadaten decken grundlegende Informationen wie Titel, Ersteller und Beschreibung ab. Das PDF-Schema enthaelt PDF-spezifische Informationen wie den PDF-Erzeuger. Benutzerdefinierte Schemata erlauben Unternehmen, eigene Metadatenfelder zu definieren. Bei der Metadatenbereinigung muessen beide Speicherorte beruecksichtigt werden, da Informationen im Dokumentinformations-Woerterbuch und in XMP-Daten unterschiedlich sein oder sich ergaenzen koennen.

Metadaten fuer die Dokumentenverwaltung nutzen

Strategisch eingesetzte Metadaten sind ein maechtigtes Werkzeug fuer die Dokumentenorganisation. Konsistente Schluesselwoerter ermoeglichen schnelles Auffinden von Dokumenten in grossen Archiven. Betreffzeilen und Kategorien unterstuetzen die automatische Klassifizierung. Versionsnummern in benutzerdefinierten Feldern vereinfachen die Dokumenthistorie. In Unternehmen koennen Metadaten-Richtlinien vorschreiben, welche Felder bei der Erstellung ausgefuellt werden muessen. Dokumentenmanagementsysteme importieren PDF-Metadaten automatisch in ihre Datenbanken, was die Erfassung und den Abruf von Dokumenten erheblich beschleunigt.

Praxisbeispiele fuer Metadaten-Risiken

Die Risiken unbereinigter Metadaten sind keine Theorie. Ein bekannter Fall betrifft ein britisches Regierungsdokument, dessen Metadaten den gesamten Bearbeitungsverlauf enthielten und vertrauliche fruehe Entwuerfe sichtbar machten. Anwaltskanzleien haben versehentlich Mandantennamen ueber das Autorenfeld preisgegeben. Unternehmen haben durch den Ersteller-Eintrag unbeabsichtigt offengelegt, welche interne Abteilung ein angeblich externes Gutachten verfasst hat. Selbst die Erstellungssoftware kann Rueckschluesse zulassen - etwa ob ein als professionell praesentiertes Dokument tatsaechlich in einer kostenlosen Textverarbeitung erstellt wurde.

Verwandte Seiten

Häufige Fragen zu PDF-Metadaten: Was sie enthalten und wie Sie sie verwalten

Verwandte Werkzeuge