Ψ Die Informatikseite
Menü
Bachelorstudium
- Lineare Algebra
- Algorithmen
- Theoretische Informatik
Masterstudium
- Neuronale Netze
- Computeranimation
Bonusmaterial
- Textsatz mit Latex
- Tipps und Tricks zu PDF-Dateien
- Einplatinenrechner
Studentenratgeber
Studienorte
Bücher
Impressum
Menü
Bachelorstudium
Lineare Algebra
Algorithmen
Theoretische Informatik
Masterstudium
Neuronale Netze
Computeranimation
Bonusmaterial
Textsatz mit Latex
Tipps und Tricks zu PDF-Dateien
Einplatinenrechner
Studentenratgeber
Studienorte
Bücher
Impressum
Informatik
»
Master
»
Neuronale Netze
»
Reinforcement Learning (Bestärkendes Lernen)
»
Reinforcment Learning mit (adaptive) Critic
Lernen der Value Function (Temporal Difference Learning)
Reinforcement Learning (Bestärkendes Lernen)
SARO (Sensor Driven Random Optimisation)
Reinforcment Learning mit (adaptive) Critic
Dies ist eine Unterart des RLs. Der Critic gibt einen Ersatz für das Reinforcmentsignal, indem er das System auswertet. Der Critic kann Adaptive sein, d.h. er lernt selbst noch.
Lernen der Value Function (Temporal Difference Learning)
Reinforcement Learning (Bestärkendes Lernen)
SARO (Sensor Driven Random Optimisation)