Sicherheit
Content Moderation
Content Moderation bezeichnet das Prüfen und Filtern von Inhalten, um schädliches Material wie Gewalt, Hassrede oder Betrug herauszuhalten. Bei KI-Systemen prüft sie sowohl die Eingaben der Nutzer als auch die erzeugten Ausgaben. Die Prüfung übernehmen oft automatische Filter, häufig ergänzt durch Menschen, da reine Automatik Grenzfälle leicht falsch einordnet.
Verwandte Begriffe