Beim Training von KI-Systemen sind Spiele ein guter Ersatz für reale Aufgaben. „Ein allgemeiner Spieleagent könnte im Prinzip viel mehr darüber lernen, wie man sich in unserer Welt zurechtfindet als alles andere in einer einzelnen Umgebung“, sagt Michael Bernstein, außerordentlicher Professor für Informatik an der Universität in Stanford, der nie teilgenommen hat. der Forschung.

„Man könnte sich vorstellen, dass wir eines Tages statt übermenschlicher Agenten, gegen die man spielt, Agenten wie SIMA haben könnten, die neben einem in Spielen mit euch und euren Freunden spielen“, sagt Tim Harley, Forschungsingenieur bei Google DeepMind Teil des Projekts. das Team, das den Agenten entwickelt hat.

Das Team schulte SIMA anhand zahlreicher Beispiele von Menschen, die einzeln und gemeinsam Videospiele spielten, sowie an Tastatur- und Mauseingaben und Anmerkungen zu den Aktionen der Spieler im Spiel, erklärt Frédéric Besse, Forschungsingenieur bei Google DeepMind.

Dann verwendeten sie eine KI-Technik namens Imitation Learning, um dem Agenten beizubringen, Spiele wie Menschen zu spielen. SIMA kann 600 grundlegende Anweisungen befolgen, wie zum Beispiel „Links abbiegen“, „Leiter hinaufsteigen“ und „Karte öffnen“, die jeweils in weniger als etwa 10 Sekunden ausgeführt werden können.

Das Team stellte fest, dass ein SIMA-Agent, der in vielen Spielen trainiert wurde, bessere Leistungen erbrachte als ein Agent, der gelernt hatte, nur eines zu spielen. Tatsächlich konnte er die zwischen den Spielen gemeinsamen Konzepte nutzen, um bessere Fertigkeiten zu erlernen und Anweisungen besser auszuführen, erklärt Besse.

„Es ist wieder eine wirklich spannende Schlüsselimmobilie, weil wir einen Agenten haben, der Spiele spielen kann, die er noch nie zuvor gesehen hat“, sagt er.

Diese Art des Wissenstransfers zwischen Spielen zu sehen, sei ein wichtiger Schritt für die KI-Forschung, sagt Paulo Rauber, Dozent für künstliche Intelligenz an der Queen Mary University of London.

Die Grundidee, das Ausführen von Anweisungen anhand von Beispielen von Menschen zu lernen, könnte in Zukunft zu leistungsfähigeren Systemen führen, insbesondere bei größeren Datenmengen, sagt Rauber. Der relativ begrenzte Datensatz von SIMA schränke seine Leistung ein, sagt er.

By rb8jg

Leave a Reply

Your email address will not be published. Required fields are marked *