Ψ Die Informatikseite
Menü
Bachelorstudium
- Lineare Algebra
- Algorithmen
- Theoretische Informatik
Masterstudium
- Neuronale Netze
- Computeranimation
Bonusmaterial
- Textsatz mit Latex
- Tipps und Tricks zu PDF-Dateien
- Einplatinenrechner
Studentenratgeber
Studienorte
Bücher
Impressum
Menü
Bachelorstudium
Lineare Algebra
Algorithmen
Theoretische Informatik
Masterstudium
Neuronale Netze
Computeranimation
Bonusmaterial
Textsatz mit Latex
Tipps und Tricks zu PDF-Dateien
Einplatinenrechner
Studentenratgeber
Studienorte
Bücher
Impressum
Informatik
»
Master
»
Neuronale Netze
»
Reinforcement Learning (Bestärkendes Lernen)
»
Value Function beim Reinforcement Learning (Bestärkenden Lernen)
Idee bzw. Aufgabe des Reinforcement Learnings (Bestärkendes Lernen)
Reinforcement Learning (Bestärkendes Lernen)
Greedy-Policy vs. Optimal Policy beim Reinforcement Learning (Bestärkenden Lernen)
Unterabschnitte
State Value Function
Action Value Function
Value Function beim Reinforcement Learning (Bestärkenden Lernen)
State Value Function
Die
State Value Function
bewertet eine Situation des Systems. Es wird bewertet, was wir aufgrund der Policy
aus diesem Status für ein Return haben können.
Action Value Function
Die
Aktion Value Function
bewertet eine Aktion des Agentens.
Idee bzw. Aufgabe des Reinforcement Learnings (Bestärkendes Lernen)
Reinforcement Learning (Bestärkendes Lernen)
Greedy-Policy vs. Optimal Policy beim Reinforcement Learning (Bestärkenden Lernen)