Bei der Entwicklung von Open-Source-KI-Software werden die Trainingsdatensätze oft nicht öffentlich preisgegeben. Der Grund: Es bestehen zu viele rechtliche Unsicherheiten, ob Datensätze, die auch für das Training von KI-Modellen nutzbar sind, unter die Ausnahme zum Text- und Data-Mining im Urheberr...
Was hier am Ende des Rechtsstreits entschieden wird, wird auch Auswirkungen auf die Arbeit von Wikimedia haben, gerade was unsere Arbeit in der Softwareabteilung mit Open-Source-Communitys betrifft.