Visual processing in context of reinforcement learning

In dieser Arbeit werden drei verschiedene Repräsentationslernalgorithmen im Kontext von Verstärkungslernen (VL) vorgestellt: (i) GrICA ist von der unabhängigen Komponentenanalyse (ICA) inspiriert und trainiert ein tiefes neuronales Netzwerk, um statistisch unabhängige Komponenten der Eingabe auszugeben. (ii) Latent Representation Prediction (LARP) lernt Zustandsdarstellungen, indem sie die Darstellung des nächsten Zustands der Umgebung mithilfe eines aktuellen Zustands und einer aktuellen Aktion vorhersagt. (iii) RewPred lernt die Zustandsdarstellung, indem ein tiefes neuronales Netzwerk trainiert wird, eine geglättete Version der Belohnungsfunktion zu lernen. Wir stellen fest, dass jede Methode ihre Stärken und Schwächen hat, und schließen aus unseren Experimenten, dass das Einbeziehen von unbeaufsichtigtem Repräsentationslernen in VL-Problemlösungspipelines das Lernen beschleunigen kann.

Metadaten
Author:	Hlynur Davíð Hlynsson GND
URN:	urn:nbn:de:hbz:294-90324
DOI:	https://doi.org/10.13154/294-9032
Referee:	Laurenz Wiskott ORCiD GND, Tobias Glasmachers GND
Document Type:	Doctoral Thesis
Language:	English
Date of Publication (online):	2022/06/13
Date of first Publication:	2022/06/13
Publishing Institution:	Ruhr-Universität Bochum, Universitätsbibliothek
Granting Institution:	Ruhr-Universität Bochum, Fakultät für Elektrotechnik und Informationstechnik
Date of final exam:	2022/03/17
Creating Corporation:	Fakultät für Elektrotechnik und Informationstechnik
GND-Keyword:	Aktives maschinelles Lernen; Operante Konditionierung; Neuronales Netz; Deep learning; Unüberwachtes Lernen
Institutes/Facilities:	Institut für Neuroinformatik
Dewey Decimal Classification:	Allgemeines, Informatik, Informationswissenschaft / Informatik
faculties:	Fakultät für Elektrotechnik und Informationstechnik
Licence (German):	Keine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht

RUB » Bibliotheksportal