Was ist Reinforcement Learning?

Question

Accepted Answer

Reinforcement Learning (RL) ist ein Teilgebiet des maschinellen Lernens, bei dem ein Agent durch Interaktion mit einer Umgebung lernt, optimale Entscheidungen zu treffen. Der Agent erhält für seine Aktionen Rückmeldungen in Form von Belohnungen (Rewards) oder Bestrafungen und passt sein Verhalten so an, dass er langfristig möglichst viel Belohnung erhält.

Im Gegensatz zu überwachtem Lernen gibt es beim Reinforcement Learning keine festen Eingabe-Ausgabe-Paare. Stattdessen entdeckt der Agent durch Ausprobieren (Trial-and-Error), welche Aktionen in bestimmten Situationen am vorteilhaftesten sind. Typische Anwendungen sind Spiele, Robotik oder autonome Systeme.

Die wichtigsten Begriffe im Reinforcement Learning sind:

- **Agent**: Das lernende System, das Entscheidungen trifft.
- **Umgebung (Environment)**: Die Welt, in der der Agent agiert.
- **Zustand (State)**: Die aktuelle Situation des Agenten in der Umgebung.
- **Aktion (Action)**: Eine Handlung, die der Agent ausführen kann.
- **Belohnung (Reward)**: Rückmeldung der Umgebung, wie gut eine Aktion war.
- **Politik (Policy)**: Die Strategie, nach der der Agent seine Aktionen auswählt.

Bekannte Algorithmen im Reinforcement Learning sind Q-Learning, Deep Q-Networks (DQN) und Policy-Gradient-Methoden.

Was ist Reinforcement Learning?

Verwandte Fragen

Wie wird KI programmiert?

Was kann KI nicht?