Gastbeitrag

Gastbeitrag: Synthetische Daten zur Sicherung europäischer Datensouveränität

11. Oktober 2025

Synthetische Daten zur Sicherung europäischer Datensouveränität

Das Training von KI-Modellen verlangt eine Vielzahl qualitativ hochwertiger Datensätze. Um der daraus resultierenden Datenknappheit in gewissen Bereichen entgegenzuwirken, muss zunehmend auf innovative Maßnahmen zurückgegriffen werden. Im Projekt plAIdata werden daher Methoden zur Erstellung synthetischer Datensätze in der technischen Planung erforscht.

AI based PLanning and monitoring of buildings towards Data sovereignty (plAIdata) ist ein von der Forschungsförderungsgesellschaft (FFG) gefördertes Projekt der Projektpartner Joanneum Research (JR), XCAD, Dibit und des Instituts für Innovation und Digitalisierung im Recht der Universität Wien. Unter der Leitung von JR wird der technische Aspekt der Erstellung synthetischer Daten für die Use Cases Innenraumplanung (mit xCAD) und Tunnelmonitoring (mit Dibit) erforscht. Das Hauptaugenmerk liegt hierbei auf der Vervielfältigung selten vorkommender Objekte für das Training spezialisierter KI-Modelle. Im Bereich derartig spezialisierter Datensätze sind Entwickler derzeit von außereuropäischen Quellen abhängig, was Datenbeschaffung aufwändig und teuer macht. Die Erstellung synthetischer Daten, welche auf der Grundlage der zur Verfügung stehenden Datensätze mit eigenen technischen Methoden hergestellt werden, kann hier Abhilfe schaffen.

Neben dem technischen Aspekt der Erstellung synthetischer Daten sollen im Zuge des Projekts auch die rechtlichen Rahmenbedingungen dieses Vorhabens analysiert werden. Das Institut für Innovation und Digitalisierung im Recht der Universität Wien untersucht hierfür das Konzept „synthetische Daten“ insbesondere aus den Perspektiven des Geistigen Eigentums, des Datenschutzrechts, der KI-Regulierung und des Datenwirtschaftsrechts und trägt somit zu einer rechtssicheren Durchführung des Projekts bei.

In der Rechtswissenschaft wird in der Synthetisierung insbesondere eine Möglichkeit für die Erstellung anonymer Daten und somit für das Entfliehen aus dem Anwendungsbereich der DSGVO gesehen. Dass in synthetischen Daten jedoch keineswegs ein derartiges datenschutzrechtliches Allheilmittel gesehen werden kann und dass es, wie so oft, „darauf ankommt“, lehrt bereits der EuGH in seiner ständigen Rechtsprechung, welche einen auf das Re-Identifikationsrisiko bedachten Ansatz der Anonymisierung vorgibt. Trotzdem bringen synthetische Daten viele datenschutzrechtliche Vorteile mit sich, da sie jedenfalls als PET (Privacy Enhancing Technology) betrachtet werden können und der Datenminimierung dienen. Zu beachten ist jedoch die Pflicht zur Einhaltung der Bestimmungen der DSGVO für den Prozess der Synthetisierung personenbezogener Daten, welche in der Praxis leicht übersehen werden kann.

Bei der Erstellung synthetischer Daten ist auch auf anderweitigen Schutz der Basisdatensätze zu achten. Die Verarbeitung von durch Urheberrecht im Allgemeinen und Datenbankschutz im Besonderen geschützten Datensätzen muss jedenfalls auf eine Lizenz oder eine freie Werknutzung gestützt werden – hier ist bei der KI-gestützten Erstellung von synthetischen Daten insbesondere auf die Privilegierung des Text- und Data-Minings Bedacht zu nehmen. Weiters stellen sich Fragen nach der Schützbarkeit des Outputs des Synthetisierungsprozesses und dessen rechtssichere Weiterverwertung.

Die Forschenden des Instituts für Innovation und Digitalisierung im Recht stehen bei diesen Fragen beratend zur Seite und möchten mit den aus plAIdata resultierenden Forschungsergebnissen zum rechtswissenschaftlichen Diskurs dieses aktuellen Themas beitragen.

Autoren: Michael Schmidbauer und Boris Kandov, Universität Wien, Institut für Innovation und Digitalisierung im Recht

The research leading to these results has been funded partially from the Austrian Research Promotion Agency (FFG) in the programme “Digitale Technologien”.

Kommen Sie zur diesjährigen Legal Tech Konferenz!
Es erwartet Sie ein spannender Tag rund um das Thema Digitalisierung und Legal Tech