Training
Reinforcement Learning
Reinforcement Learning, auf Deutsch bestärkendes Lernen, ist eine Methode, bei der ein System durch Ausprobieren lernt und für gute Entscheidungen Belohnungen, für schlechte Strafen erhält. Über viele Versuche entwickelt es so eine Strategie, die die Belohnung maximiert. Diese Methode steckt zum Beispiel hinter Spiele-KIs und wird auch genutzt, um Sprachmodelle an menschliche Vorlieben anzupassen.
Verwandte Begriffe