Gerhard Zauchinger, 37 Jahre, wohnhaft in Wien Leopoldstadt, verheiratet und Vater einer 1-jährigen Tochter, hat letzten Samstag 83,26 Euro im Supermarkt ausgegeben, davon entfielen 19,39 Euro auf Windeln. Er ist Teil einer umfassenden Studie, in der die Daten von tausenden Individuen detailliert ausgewertet werden, um Schlüsse über das Einkaufsverhalten in Österreich zu ziehen. Bloß: Gerhard Zauchinger und all die anderen existieren nicht. Sie sind allesamt Teil einer simulierten Population an synthetischen Kunden, die als Einzelne realistisch, und als Ganzes wiederum repräsentativ sind, aber keinerlei direkten Bezug zu real existierenden Menschen aufweisen. So ungefähr kann man sich das vorstellen, was die vom Wiener Startup Mostly AI entwickelte Technologie vermag.

+++ Fokus: Artificial Intelligence +++

Datenschutz vs. Innovation

Doch warum einen Gerhard Zauchinger synthetisch erstellen, wenn man doch einfach echte Kundendaten verwenden könnte? “Das allgemeine Bewusstsein zu Datenschutz ist aufgrund diverser Skandale und auch dank der Einführung der DSGVO stark gestiegen. Letztere setzt relativ enge Rahmenbedingungen für die Verarbeitung und Weitergabe von personenbezogenen Daten. Und das ist auch gut so”, sagt Michael Platzer, Co-Founder und CEO von Mostly AI. Die Gesetzespakete im Rahmen der DSGVO-Umsetzung hätten Hand und Fuß und viele Länder, wie etwa die USA, setzen Schritte um dem europäischen Beispiel zu folgen. “Auf der anderen Seite kann die breite Verwendung dieser personenbezogenen Daten der Gesellschaft aber einen immensen Nutzen bringen, etwa für die Forschung, für die Produktentwicklung, oder aber auch für einen schonenderen Umgang mit Ressourcen”, sagt Platzer.

“Wir lösen ein grundlegendes Dilemma”

Und hier kämen synthetische Daten ins Spiel. Dank generativer AI vermag die Software von Mostly AI anhand “echter” Datensätze Muster und Zusammenhänge erlernen und kreiert daraufhin ein Sample von “erfundenen” Datensätzen, die wieder weitestgehend dieselben Eigenschaften haben wie die Originaldaten. “Wir lösen damit ein grundlegendes Dilemma”, erklärt CEO Platzer. Denn man ermögliche es dadurch Informationen und somit den Wert von Daten zu erhalten, und diese – entgeltlich oder unentgeltlich – weiterzugeben unter gleichzeitiger Wahrung der Privatsphäre jeder einzelnen Person.

Namen schwärzen bringt nichts

Denn klassische Anonymisierung, wie sie häufig stattfinde, sei im Internetzeitalter unwirksam. “Es ist wie der Anonymitätsbalken auf Portrait-Fotos. Wenn man das Gesicht kennt, bringt der Balken über den Augen nichts. Und eine AI-basierte Bilderkennung könnte die Person selbst noch anhand der Ohrläppchen identifizieren”, sagt der CEO. Mit Datensätzen verhalte es sich ähnlich. Anhand von wenigen Datenpunkten – etwa der Anzahl der Kinder, der Postleitzahl und der gefahrenen Automarke – könne man bereits einen Großteil der Personen reidentifizieren. Ein paar Datenpunkte mehr und man könne ausnahmslos jeden zurückverfolgen. “Nur den Namen zu schwärzen bringt also nichts”, sagt Platzer.

Mostly AI-Software auf den Servern der Kunden

Und die Mostly AI-Kunden müssen ihre Daten für das Service nicht dem Startup geben. Man verfolgt ein Subscription-basiertes Modell, bei dem die Software auf den Servern der Kunden läuft – die personenbezogenen Daten verlassen also nicht das Unternehmen oder die Institution. Diese Kunden kommen bislang vorwiegend aus dem Bankensektor, wo Mostly AI erfolgreich mit Finanztransaktionsdaten arbeitet. “Weitere sehr spannende Anwendungsbereiche sind für uns auch die besonders sensiblen Gesundheitsdaten und Mobilitätsdaten”, erklärt Platzer. Letztlich ließe sich die Technologie aber überall dort anwenden, wo mit großen personenbezogenen Datensätzen gearbeitet wird. “Unser Produkt richtet sich also vorwiegend an Großkonzerne, aber auch an Unternehmen mit einem großen Kundenstock, die ihre Daten intern und extern besser nutzbar machen wollen”.

Rund 1 Mio. Euro von 42CAP und Push Ventures

Und nicht nur große Kunden konnte Mostly AI mit seiner Lösung überzeugen. Das Gründer-Team – Platzer ist Mathematiker und Ökonom, seine beiden Co-Founder, Klaudius Kalcher und Roland Boubela, medizinische Physiker – konnte nun auch zwei Investment-Gesellschaften für eine Kapital-Runde gewinnen. Rund eine Million Euro kommen von 42CAP und Push Ventures. “Ausschlag hat für uns ihre Erfahrung und die persönliche Betreuung durch die Investoren gegeben. Sie verstehen sowohl die Technik als auch den Markt”, sagt Platzer.

“Wir müssen den Markt erst mitentwickeln”

Das Data Science-erfahrene und eher wissenschaftslastige Team – Platzer wurde für die Forschungsergebnisse seiner Dissertation sogar vom US-Marketing-Verband als Forscher des Jahres ausgezeichnet – will sich mit dem Kapital nun auf wirtschaftlicher Seite stärker aufstellen. Positionen in den Bereichen Business Development und Marketing wurden gerade ausgeschrieben. Dann will man zunächst gezielt weitere Großbanken Europas ansprechen. “Wir müssen den Markt für KI-basierende synthetische Daten gewissermaßen erst mitentwickeln, da er so noch nicht existiert. Eine sehr spannende Herausforderung, und auch eine Frage des Timings. Daten-verarbeitende Organisationen gilt es einerseits über die neuen Möglichkeiten zu informieren, und andererseits natürlich von der Qualität unser Technologie überzeugen”, sagt der CEO. Gerhard Zauchinger und seine Mitgenossen könnten uns jedenfalls in Zukunft noch öfter begegnen.

 Zur Page des Startups