Die eigentlichen use cases sind:
- Als Leser will ich klar unterscheiden können: Was ist komplett automatisiert generiert und flutet die Netze? Und was ist von einem menschlichen Gegenüber letztendlich verfasst?
- Als Designer als eines Modells will ich bei den Trainingsdaten sauber unterscheiden können: Was ist von Software generiert, was von Menschen?
Diese Unterscheidung sagt nichts über Wahrheit oder Wertigkeit aus, wohl aber über die Qualität als Trainingsdaten und als Informationsquelle. Nur so kann man vergleichen, unterscheiden usw.. Das wird aber nicht möglich sein, wenn man bloß verlangt, dass KI-generierte Inhalte gekennzeichnet werden. Der ganze große Rest kann doch alles Mögliche enthalten. Denn das Interesse böswilliger Akteure, KI-Generiertes nicht zu labeln ist groß und der potenzielle Schaden beim Auffliegen ist gering. Also wird der ganze Rest viel Müll enthalten.
Der logische andere Ansatz: Inhalte, die von Menschen generiert wurden, als solche labeln. Ein Bio-Label. Freiwillig!
Konrad Lischka, 03.01.2024 (online)