Zum Glossar
Sicherheit

Alignment

Alignment (Ausrichtung) bezeichnet die Aufgabe, ein KI-System so zu gestalten, dass sein Verhalten den Absichten und Werten der Menschen entspricht, die es nutzen. Dazu gehört, dass das System hilfreiche Antworten gibt und schädliche oder unerwünschte Ausgaben vermeidet. Alignment ist schwierig, weil sich menschliche Ziele oft nicht vollständig in klare Regeln fassen lassen.