„Es ist eine coole Arbeit“, sagt Matthew Guzdial, ein KI-Forscher an der University of Alberta, der vor einigen Jahren einen ähnlichen Spielegenerator entwickelt hat.
Genie wurde anhand von 30.000 Stunden Videomaterial von Hunderten von 2D-Plattformspielen aus dem Internet geschult. Andere hätten diesen Ansatz bereits gewählt, sagt Guzdial. Ein eigener Spielegenerator lernte aus Videos, abstrakte Plattformspiele zu erstellen. Nivida nutzte Videodaten, um ein Modell namens GameGAN zu trainieren, das Klone von Spielen wie Pac-Man erstellen konnte.
Aber alle diese Beispiele trainierten das Modell mit Eingabeaktionen und Tastendrücken auf einem Controller sowie Videomaterial: Ein Videobild, das Mario beim Springen zeigt, war mit der Aktion „Springen“ verknüpft und so weiter. Das Markieren von Videosequenzen mit Eingabeaktionen ist arbeitsintensiv, wodurch die Menge der verfügbaren Trainingsdaten begrenzt ist.
Im Gegensatz dazu wurde Genie nur auf Videomaterial geschult. Anschließend erfuhr er, welche von acht möglichen Aktionen dazu führen würde, dass die Spielfigur in einem Video ihre Position ändert. Dadurch wurden unzählige Stunden vorhandener Online-Videos in potenzielle Trainingsdaten umgewandelt.
Genie generiert jeden neuen Frame des Spiels im Handumdrehen basierend auf der Aktion des Spielers. Drücken Sie „Sprung“ und Genie aktualisiert das aktuelle Bild, um den springenden Spielcharakter zu zeigen. Drücken Sie Links und das Bild ändert sich und zeigt das nach links verschobene Zeichen. Das Spiel schreitet Aktion für Aktion voran, wobei beim Spielen jedes neue Bild von Grund auf neu generiert wird.
Zukünftige Versionen von Genie werden möglicherweise schneller ausgeführt. „Es gibt keine grundlegenden Einschränkungen, die uns daran hindern, 30 Bilder pro Sekunde zu erreichen“, sagt Tim Rocktäschel, Forscher bei Google DeepMind, der das Team hinter der Arbeit leitet. „Genie nutzt viele der gleichen Technologien wie große zeitgenössische Sprachmodelle, bei denen erhebliche Fortschritte bei der Verbesserung der Inferenzgeschwindigkeit erzielt wurden.“
Genie lernte einige typische visuelle Besonderheiten kennen, die in Plattformspielen zu finden sind. Viele Spiele dieser Art verwenden Parallaxe, bei der sich der Vordergrund schneller seitwärts bewegt als der Hintergrund. Genie fügt diesen Effekt häufig den von ihm generierten Spielen hinzu.
Obwohl Genie ein internes Forschungsprojekt ist und nicht veröffentlicht wird, merkt Guzdial an, dass das Google DeepMind-Team sagt, dass es eines Tages in ein Tool zur Spieleerstellung umgewandelt werden könnte, woran er auch arbeitet. „Ich bin wirklich daran interessiert zu sehen, was sie bauen“, sagte er.