Game Learningc4board

Bei Spielen interessieren mich besonders strategische Aspekte und weiterhin, ob ein Computer erfolgreich lernen kann, ein Spiel zu spielen. D. h. ob er (ohne explizites Programm oder erschöpfende Baumsuche) allein aus Spielen gegen sich selbst eigenständig die richtigen Strategien erlernen kann.

In unserer Arbeitsgruppe befassen wir uns intensiv mit dem Spiel "Vier Gewinnt" ("Connect-4"). Wir haben einen Connect-4-Agenten entwickelt, der allein durch Self-Play das Spiel Vier Gewinnt nahezu perfekt erlernt. Unser Java-basiertes Connect-4 Game Playing Framework (C4GPF) steht nun für interessierte Forscher als Open-Source Projekt  auf GitHub zur Verfügung. Mehr…

Download C4GPF from GitHub

Das langfristige Ziel ist es, die Erkenntnisse zu Game-Learning-Strategien auch auf andere Spiele (2048, Dots-and-Boxes, Go, Schach, Dame, Abalone, Sim …) zu übertragen.Das zugehörige Forschungsfeld heißt General Game Playing (GGP) und hat zum Ziel, Agenten zu entwickeln, die verschiedenste Spiele erlernen können.

Weiterhin werden im WPF Spiele + Simulation die Grundlagen zu Simulation und Game Physics, der realistischen Kinematik und Dynamik in Spielwelten, vermittelt.

Projektbeteiligte

saminehBagheri   Samineh Bagheri, M.Sc., TH Köln markus2 Markus Thill, M.Sc., TH Köln
patrickPortrait Dr. Patrick Koch, TH Köln konen-3   Prof. Dr. Wolfgang Konen, TH Köln

 

Publikationen 'Spiele'

2016

Bagheri, Samineh; Thill, Markus; Koch, Patrick; Konen, Wolfgang

Online Adaptable Learning Rates for the Game Connect-4 Artikel

IEEE Transactions on Computational Intelligence and AI in Games, 8 (1), S. 33-42, 2016, (accepted 11/2014).

Links | BibTeX

2015

Konen, Wolfgang

Reinforcement Learning for Board Games: The Temporal Difference Algorithm Forschungsbericht

Research Center CIOP (Computational Intelligence, Optimization and Data Mining) Cologne University of Applied Sciences, 2015.

Links | BibTeX

Konen, Wolfgang

Reinforcement Learning für Brettspiele: Der Temporal Difference Algorithmus Forschungsbericht

Research Center CIOP (Computational Intelligence, Optimization and Data Mining) Cologne University of Applied Science, 2015, (Updated version 2015).

Links | BibTeX

2014

Thill, Markus; Konen, Wolfgang

Connect-4 Game Playing Framework (C4GPF) Sonstige

2014.

Links | BibTeX

Konen, Wolfgang; Koch, Patrick

Adaptation in Nonlinear Learning Models for Nonstationary Tasks Konferenzbeitrag

Bartz-Beielstein, T; Filipic, B (Hrsg.): PPSN'2014: 13th International Conference on Parallel Problem Solving From Nature, Ljubljana, S. 292–301, Springer, Heidelberg, 2014.

Links | BibTeX

Bagheri, Samineh; Thill, Markus; Koch, Patrick; Konen, Wolfgang

Online Adaptable Learning Rates for the Game Connect-4 Forschungsbericht

CIplus (TR 03/2014), 2014, (Preprint version of the article in IEEE Transactions on Computational Intelligence and AI in Games, 2016).

Links | BibTeX

Thill, Markus; Bagheri, Samineh; Koch, Patrick; Konen, Wolfgang

Temporal Difference Learning with Eligibility Traces for the Game Connect-4 Konferenzbeitrag

Preuss, Mike ; Rudolph, Günther (Hrsg.): CIG'2014, International Conference on Computational Intelligence in Games, Dortmund, S. 84 – 91, 2014.

Links | BibTeX

2012

Thill, Markus; Koch, Patrick; Konen, Wolfgang

Reinforcement learning with n-tuples on the game Connect-4 Konferenzbeitrag

Coello Coello, Carlos ; Cutello, Vincenzo ; others, (Hrsg.): PPSN'2012: 12th International Conference on Parallel Problem Solving From Nature, Taormina, S. 184–194, Springer, Heidelberg, 2012.

Links | BibTeX

Thill, Markus

Reinforcement Learning mit N-Tupel-Systemen für Vier Gewinnt Abschlussarbeit

TH Köln -- University of Applied Sciences, 2012, (Bachelor thesis, 1st prize in Opitz award 2013, Festo award 2012, Ferchau award 2012).

Links | BibTeX

2011

Konen, Wolfgang

Self-configuration from a Machine-Learning Perspective Forschungsbericht

Research Center CIOP (Computational Intelligence, Optimization and Data Mining) Cologne University of Applied Science, Faculty of Computer Science and Engineering Science, (05/11; arXiv: 1105.1951), 2011, ISSN: 2191-365X, (e-print published at http://arxiv.org/abs/1105.1951 and Dagstuhl Preprint Archive, Workshop 11181 "Organic Computing -- Design of Self-Organizing Systems").

Links | BibTeX

2009

Konen, Wolfgang; Bartz-Beielstein, Thomas

Reinforcement learning for games: failures and successes -- CMA-ES and TDL in comparision Konferenzbeitrag

GECCO '09: Proceedings of the 11th Annual Conference Companion on Genetic and Evolutionary Computation Conference, S. 2641–2648, ACM, Montreal, Québec, Canada, 2009.

Links | BibTeX

Konen, Wolfgang; Bartz-Beielstein, Thomas

Evolutionsstrategien und Reinforcement Learning für strategische Brettspiele Forschungsbericht

Cologne University of Applied Sciences 2009.

Links | BibTeX

2008

Konen, Wolfgang; Bartz-Beielstein, Thomas

Reinforcement Learning: Insights from Interesting Failures in Parameter Selection Konferenzbeitrag

Rudolph, Günter ; others, (Hrsg.): PPSN'2008: 10th International Conference on Parallel Problem Solving From Nature, Dortmund, S. 478–487, Springer, Berlin, 2008.

Links | BibTeX

Konen, Wolfgang

Reinforcement Learning für Brettspiele: Der Temporal Difference Algorithmus Forschungsbericht

Cologne University of Applied Sciences 2008.

Links | BibTeX

Konen, Wolfgang; Bartz-Beielstein, Thomas

Reinforcement Learning für strategische Brettspiele Forschungsbericht

Cologne University of Applied Sciences 2008.

Links | BibTeX