Abstract:
Diese Arbeit untersucht die Durchführbarkeit der Quantenverschränkung zur Verbesserung der Kooperation im Multi-Agenten Reinforcement Learning. Unter Verwendung des iterierten Gefangenendilemmas als Benchmark, schlagen wir ein dezentralisiertes Multi-Agenten Reinforcement Learning (MARL) vor in dem zwei Agenten, die mit variablen Quantenschaltungen ausgestattet sind, sich gegenseitig durch Quantenverschränkung beeinflussen können. Im Gegensatz zu existierenden Ansätzen, die sich auf dedizierte Quanten-Kommunikationskanäle angewiesen sind, wird in dieser Arbeit untersucht, ob die Verschränkung allein kooperative Gleichgewichte ermöglichen kann. Daher evaluieren wir die Auswirkungen verschiedener Verschränkungs-Architekturen, um kooperative Strategien zu entwickeln, die dem Nash-Gleichgewicht entgehen. Die Ergebnisse unserer Experimente zeigen, dass Verschränkung zwar Strategien ermöglichen kann Verschränkung zwar Strategien ermöglicht, die besser sind als die gegenseitige Defekt-Strategie, aber langfristig kooperatives Verhalten nicht möglich ist. Das deutet darauf hin, dass Quantenkorrelationen allein nicht ausreichen, um kooperative Strategien in Multi-Agenten Reinforcement Learning aufrechtzuerhalten.
Autor/in:
Marvin Heinrich
Betreuer:
Michael Kölle, Leo Sünkel, Claudia Linnhoff-Popien
Studentische Abschlussarbeit | Veröffentlicht März 2025 | Copyright © QAR-Lab
Anfragen zu dieser Arbeit an die Betreuer