Visual processing in context of reinforcement learning
- In dieser Arbeit werden drei verschiedene Repräsentationslernalgorithmen im Kontext von Verstärkungslernen (VL) vorgestellt: (i) GrICA ist von der unabhängigen Komponentenanalyse (ICA) inspiriert und trainiert ein tiefes neuronales Netzwerk, um statistisch unabhängige Komponenten der Eingabe auszugeben. (ii) Latent Representation Prediction (LARP) lernt Zustandsdarstellungen, indem sie die Darstellung des nächsten Zustands der Umgebung mithilfe eines aktuellen Zustands und einer aktuellen Aktion vorhersagt. (iii) RewPred lernt die Zustandsdarstellung, indem ein tiefes neuronales Netzwerk trainiert wird, eine geglättete Version der Belohnungsfunktion zu lernen. Wir stellen fest, dass jede Methode ihre Stärken und Schwächen hat, und schließen aus unseren Experimenten, dass das Einbeziehen von unbeaufsichtigtem Repräsentationslernen in VL-Problemlösungspipelines das Lernen beschleunigen kann.
Author: | Hlynur Davíð HlynssonGND |
---|---|
URN: | urn:nbn:de:hbz:294-90324 |
DOI: | https://doi.org/10.13154/294-9032 |
Referee: | Laurenz WiskottORCiDGND, Tobias GlasmachersGND |
Document Type: | Doctoral Thesis |
Language: | English |
Date of Publication (online): | 2022/06/13 |
Date of first Publication: | 2022/06/13 |
Publishing Institution: | Ruhr-Universität Bochum, Universitätsbibliothek |
Granting Institution: | Ruhr-Universität Bochum, Fakultät für Elektrotechnik und Informationstechnik |
Date of final exam: | 2022/03/17 |
Creating Corporation: | Fakultät für Elektrotechnik und Informationstechnik |
GND-Keyword: | Aktives maschinelles Lernen; Operante Konditionierung; Neuronales Netz; Deep learning; Unüberwachtes Lernen |
Institutes/Facilities: | Institut für Neuroinformatik |
Dewey Decimal Classification: | Allgemeines, Informatik, Informationswissenschaft / Informatik |
faculties: | Fakultät für Elektrotechnik und Informationstechnik |
Licence (German): | Keine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht |