Was ist Provenance?

Provenance haben oder nicht, das kann unter Umständen mehrere Millionen Dollar bedeuten. Wo kommt etwas her, wie und von wem wurde es unterwegs verändert, das ist Provenance. Diese Informationen helfen uns Menschen Dinge zu bewerten. Welche Fragen gilt es zu beantworten und was ist meine Rolle als Informatiker in diesem Forschungsbereich?!

2015 wurde das Gemälde Less Femmes d’Alger von Picasso fur unglaubliche 179 Millionen Dollar verkauft. Das Gemälde La Bella Principessa von Leonardo da Vinci hingegen, wurde für gerade einmal 20.000 Dollar hergegeben. Doch weshalb erzielte das erste Gemälde soviel mehr Geld? Die Antwort ist, dass ein Dokument existiert welches alle vorherigen Besitzer und Verwahrungsorte für das erste Gemälde dokumentiert. Dieselben Informationen für das zweite Gemälde sind lückenhaft. Diese dokumentierte Besitzerhistorie wird auch Provenance (dt. Provenienz) genannt.

Warum ist Provenance so wichtig für uns?

Nehmen wir einmal an ich verkaufe ein Auto. Wenn ich dem Käufer ein Scheckheft vorzeigen kann, dass alle Inspektionen belegt, hat er mehr Vertrauen darin dass das Auto völlig funktionstüchtig ist. Ähnlich ist es auch von Interesse inwiefern das Auto verändert wurde, welche Teile beispielsweise ausgetauscht worden sind. Natürlich existiert hier kein echtes Vertrauen, aber die Provenance hilft einem beim bilden einer Meinung und erlaubt Rückschlüsse auf den Gegenstand. Neben der Qualität können auch andere Eigenschaften von Bedeutung sein. Der Wert des Autos könnte auch höher sein wenn der vorherige Besitzer ein Prominenter war.

Das Auto Beispiel zeigt die Wichtigkeit von Provenance und die Millionen Dollar Preisunterschied der Gemälde, dass es durchaus von Wert ist diese Informationen zu besitzen. Es gibt noch weit mehr Anwendungsfälle bei denen es hilfreich ist Provenance zu haben. Beispielsweise Lebensmittel. Wo kommen sie her? Wie wurden sie produziert? Wurde die Kühlkette immer eingehalten? All diese Informationen beeinflussen die Kaufentscheidung. Daher ist es ebenfalls von Interesse des Verkäufers diese Informationen auf irgend eine Art zu liefern. Es gibt aktuell sogar ein Start-Up Unternehmen namens Provenance, welches die Lieferkette transparent gestalten möchte . Informationen ob das Produkt von regionalen Produzenten stammt, oder ob die Mitarbeiter fair bezahlt werden rechtfertigen einen höheren Preis. Wohingegen diese Provenance hilft eine andere Zielgruppe anzusprechen, so sind andere Provenance Informationen wie die ununterbrochene Kühlkette gesetzlich vorgeschrieben und das Einhalten dieser, muss im Zweifelsfall belegt werden.

Provenance und Informatik

Ich bin Informatiker und nicht im Qualitätsmanagement, wo ist also die Verbindung zur Provenance? Wir leben im 21. Jahrhundert, niemand verwendet Stift und Papier um Provenance Informationen aufzuzeichnen. Automaten der Lieferkette, smarte Sensoren des Internet of Things (Iot) messen und übermitteln diese Informationen. Diese Provenance Informationen müssen dann weiterverwendbar und durchsuchbar gespeichert werden. Sagen wir einmal, ein Pharmakonzern zeichnet alle Informationen auf, vom Abfüllprozess bis hin zur Information welche Flasche an welche Apotheke verkauft worden ist. Angenommen die Provenance Informationen sind auf einer externen Festplatte verstreut in tausenden Dateien in einem eigenen Dateiformat das niemand kennt. Nachdem eine Verunreinigung einiger produzierter Medikamente festgestellt worden ist, sollten die betreffenden Flaschen die bereits verkauft worden sind vom Markt genommen werden. Jetzt kann man keine Zeit und Geld verschwenden und einen Mitarbeiter alle Dateien durchsuchen lassen, das kann Tage dauern. Ist die Provenance in einem maschinenlesbaren Format gespeichert, welches automatisiert durchsucht werden kann, bekommt man seine Antwort in Sekunden! Das Verwenden einer professionellen Datenablage, im Gegensatz zu einer externen Festplatte, erlaubt Hochverfügbarkeit und beugt Datenverlust vor. Provenance in einem standardisierten Datenformat erlaubt das Verwenden von Standardsoftware und man spart sich Zeit und Geld das Rad neu zu erfinden.

woman code

Im allgemeinen sind Standards wichtig! Man stelle sich nur vor der Smartphone Akku geht zur Neige während man bei Bekannten ist, aber das Ladekabel passt nicht in die Steckdose weil jedes Haus andere Stecker hat. Zum Glück gibt es einen Standard und jede Steckdose in einem Land oder größeren Region ist standardisiert. Dasselbe gilt für digitale Standards, PDF Dateien können auf nahezu allen Endgeräten geöffnet werden. Für Provenance hat das World Wide Web Consortium (W3C) den Standard PROV verabschiedet.

Provenance und Soziale Medien

Wo wir gerade über das World Wide Web sprechen. Jeder von uns produziert und/oder konsumiert eine unglaubliche Menge an Informationen. All die Blogs und Nachrichtenseiten , welche im Minutentakt neue Informationen liefern. Journalisten recherchieren für gewöhnlich ihre Artikel und überprüfen ihre Quellen. Aber klassische Medien sind heutzutage lediglich eine von vielen Varianten wie wir uns informieren. Soziale Medien wie Twitter oder Facebook erlauben es jedem Inhalt zu produzieren und der breiten Öffentlichkeit zur Verfügung zu stellen. Wie kann man den Wahrheitsgehalt dieses Inhalts kontrollieren? Politisch orientierte Gruppen können sogenannte Fake-News verbreiten und eine Vielzahl von Leuten beeinflussen. Wer nimmt sich schon die Zeit einen Artikel komplett zu lesen, oder seine Quellen zu überprüfen?! Eine dramatische Überschrift zusammen mit einem bewegenden Bild erzeugt wesentlich mehr Aufmerksamkeit als ein Artikel basierend auf Fakten von langweiligen Statistiken. Zusätzlich generieren solche Artikel eine Menge ‘clicks’, was bedeutet das Menschen die Artikel anklicken, die Seite besuchen und Werbung sehen wodurch der Seitenbetreiber beachtliche Summen verdienen kann. Grund genug für viele einfach Geschichten zu erfinden um Geld zu verdienen.

fake-news

Dieser gesamte Prozess der Informationsverbreitung produziert lediglich teilweise Provenance. Die Provenance ist jedoch da, irgendwie. Sie steckt implizit im Timing, der textuellen Ähnlichkeit oder den sozialen Verbindungen zwischen den Teilnehmern der Verbreitung. Diese Provenance kann teilweise rekonstruiert werden. Das bringt uns direkt zum letzten Punkt, der Forschung im Bereich Provenance. Ich forsche aktiv an diesen Themen. Welche Provenance kann rekonstruiert werden? Inwieweit ist das nützlich? Auch generelle Aspekte von Provenance sind aktuell noch nicht vollständig geklärt. Wie verwendet man Provenance, wie kann man Provenance an sich gegen Fälschung sichern? Provenance bedeutet manchmal totale Transparenz, inwieweit ist das wünschenswert? An welchem Punkt ist die Privatsphäre von Individuen gefährdet. Wie können neue Technologien helfen diese Fragen zu beantworten?

Ich hoffe es ist nun klar was Provenance ist. Was denkt Ihr, wo sonst wäre Provenance noch hilfreich? Hinterlasst einen Kommentar!

Sven Lieber
Sven Lieber
data manager

Meine Forschungsinteressen umfassen FAIR und Linked Data.