Heute gaben Boston Dynamics und das Toyota Research Institute (TRI) eine neue Partnerschaft bekannt, „um die Entwicklung universeller humanoider Roboter unter Verwendung der großen Verhaltensmodelle von TRI und des Atlas-Roboters von Boston Dynamics zu beschleunigen“. Die Verpflichtung, an einem Allzweckroboter zu arbeiten, mag diese Partnerschaft im Moment wie jedes andere kommerzielle humanoide Unterfangen erscheinen lassen, aber das ist überhaupt nicht das, was hier passiert: BD und TRI sprechen über Grundlagenforschung in der Robotik, die sich auf schwierige Probleme konzentriert (am wichtigsten) die Ergebnisse teilen.

Der breitere Kontext hier ist, dass Boston Dynamics über eine außergewöhnlich leistungsfähige humanoide Plattform verfügt, die zu fortgeschrittenen und manchmal schmerzhaften Ganzkörperbewegungen sowie relativ einfachen und groben Kraftmanipulationen fähig ist. Inzwischen arbeitet TRI seit einiger Zeit an der Entwicklung KI-basierter Lerntechniken, um eine Vielzahl komplexer Manipulationsherausforderungen zu bewältigen. TRI arbeitet an dem, was sie nennen Große Verhaltensmodelle (LBM)die man sich als Analogie zu großen Sprachmodellen (LLMs) vorstellen kann, mit Ausnahme von Robotern, die nützliche Aufgaben in der physischen Welt ausführen. Der Reiz dieser Partnerschaft liegt auf der Hand: Boston Dynamics erhält nützliche neue Funktionen für Atlas, während TRI es Atlas ermöglicht, nützliche neue Funktionen zu erkunden.

Hier ist ein wenig mehr aus der Pressemitteilung:

Das Projekt ist darauf ausgelegt, die Stärken und das Fachwissen jedes Partners gleichermaßen zu nutzen. Die physischen Fähigkeiten des neuen Atlas-Elektroroboters in Kombination mit der Fähigkeit, ein breites Spektrum an bimanuellen Ganzkörpermanipulationsverhalten programmgesteuert zu steuern und zu teleoperieren, werden es Forschungsteams ermöglichen, den Roboter für eine Reihe von Aufgaben einzusetzen und Daten darüber zu sammeln Leistung. Diese Daten werden wiederum verwendet, um das Training fortgeschrittener LBMs zu unterstützen. Dabei werden strenge Hardware- und Simulationsbewertungen eingesetzt, um zu zeigen, dass große vorab trainierte Modelle den schnellen Erwerb robuster und geschickter neuer Fähigkeiten für den gesamten Körper ermöglichen können.

Das gemeinsame Team wird auch Forschungen durchführen, um grundlegende Fragen zur Ausbildung humanoider Roboter, zur Fähigkeit von Forschungsmodellen zur Nutzung der Ganzkörpersensorik und zum Verständnis der Mensch-Roboter-Interaktion sowie von Sicherheits-/Gewährleistungsfällen zur Unterstützung dieser neuen Fähigkeiten zu beantworten.

Für weitere Details haben wir mit gesprochen Scott Kuindersma (Senior Director of Robotics Research bei Boston Dynamics) und Russ Tedrake (Vizepräsident der Robotikforschung am TRI).

Wie entstand diese Partnerschaft?

Russ Tedrake: Wir haben großen Respekt vor dem Boston Dynamics-Team und dem, was es geleistet hat, nicht nur in Bezug auf die Hardware, sondern auch in Bezug auf den Controller auf Atlas. Sie haben ihre Bemühungen im Bereich des maschinellen Lernens intensiviert, da wir immer mehr auf dem Gebiet des maschinellen Lernens arbeiten. Auf der TRI-Seite sehen wir die Grenzen dessen, was Sie tun können, wenn es um die Manipulation auf dem Tisch geht, und wir möchten darüber hinausgehen.

Scott Kuindersma: Die Kombination der Fähigkeiten und Tools, die TRI mitbringt, mit den Fähigkeiten der bestehenden Plattform, die wir bei Boston Dynamics haben, zusätzlich zu den Teams für maschinelles Lernen, die wir in den letzten zwei Jahren aufgebaut haben, versetzt uns in eine sehr gute Position, um den Erfolg zu erreichen zusammen und machen einige ziemlich unglaubliche Dinge mit Atlas.

Wie werden Sie Ihre Arbeit kommunizieren, insbesondere im Kontext der aktuellen Verrücktheit rund um Humanoiden?

Tedrake: Der Druck, etwa alle sechs Monate etwas Neues und Erstaunliches zu machen, ist derzeit enorm. In gewisser Weise ist es für das Fachgebiet gesund, so viel Energie, Enthusiasmus und Ehrgeiz zu haben. Aber ich denke auch, dass es Leute auf diesem Gebiet gibt, die den etwas längeren, tieferen Blick auf das Verständnis darüber schätzen, was funktioniert und was nicht, also müssen wir das ausbalancieren.

Das andere, was ich sagen würde, ist, dass es so viel Hype gibt. ICH Bin wir freuen uns unglaublich über das Versprechen all dieser neuen Fähigkeiten; Ich möchte nur sicherstellen, dass wir bei der Weiterentwicklung der Wissenschaft auch ehrlich und transparent über ihre Wirksamkeit sind.

Kuindersma: Keinem unserer Unternehmen ist bewusst, dass dies vielleicht eine der aufregendsten Zeiten in der Geschichte der Robotik ist, aber es gibt noch viel zu tun.

Welche Herausforderungen wird Ihre Partnerschaft besonders lösen können?

Kuindersma: Eines der Dinge, die uns beide begeistern, ist die Bandbreite an Verhaltensweisen, die mit Humanoiden möglich sind: Ein humanoider Roboter ist viel mehr als eine Zange auf einer mobilen Basis. Ich denke, die Möglichkeit, das gesamte Spektrum der Verhaltensfähigkeiten von Humanoiden zu erforschen, ist aufgrund der historischen Arbeit, die wir bei Boston Dynamics geleistet haben, wahrscheinlich etwas, für das wir derzeit einzigartig positioniert sind. Atlas ist ein körperlich sehr leistungsfähiger Roboter, der effizienteste Humanoide, den wir je gebaut haben. Und die Plattformsoftware, über die wir verfügen, macht Dinge wie die Datenerfassung für Ganzkörpermanipulationen so einfach wie überall auf der Welt.

Tedrake: Meiner Meinung nach haben wir wirklich eine völlig neue Wissenschaft eröffnet: Es gibt eine Reihe neuer grundlegender Fragen, die beantwortet werden müssen. Die Robotik ist in die Ära der großen Wissenschaft eingetreten, in der ein großes Team, ein großes Budget und starke Mitarbeiter erforderlich sind, um riesige Datensätze zu erstellen und die Modelle zu trainieren, damit sie diese grundlegenden Fragen stellen können.

Grundlegende Fragen wie „Was?“

Tedrake: Niemand hat eine Ahnung, was der richtige Trainingsanzug für Humanoiden ist. Wir möchten zum Beispiel die Sprache vorab trainieren, das ist viel besser, aber an welchem ​​Punkt stellen wir die Vision vor? Wann sollten wir Maßnahmen einführen? Niemand weiß es. Was ist der richtige Aufgabenplan? Wollen wir einfache Aufgaben, bei denen wir sofort eine Leistung erzielen, die über Null liegt? Wahrscheinlich. Wollen wir auch wirklich komplizierte Aufgaben? Wahrscheinlich. Wir wollen einfach nur zu Hause sein? Nur in der Fabrik? Was ist die richtige Mischung? Wollen wir Backflips? Ich weiß nicht. Wir müssen es verstehen.

Es stellen sich auch andere Fragen, etwa ob wir über genügend Daten im Internet verfügen, um Roboter zu trainieren, und wie wir die Fähigkeiten von Internet-Datensätzen kombinieren und auf die Robotik übertragen könnten. Unterscheiden sich Bot-Daten grundlegend von anderen Daten? Sollten wir die gleichen Skalierungsgesetze erwarten? Sollten wir langfristig die gleichen Fähigkeiten erwarten?

Das andere große Problem, über das Experten sprechen werden, ist die Bewertung, die einen großen Engpass darstellt. Wenn Sie sich einige dieser Papiere ansehen, die unglaubliche Ergebnisse zeigen, ist die statistische Aussagekraft ihres Ergebnisabschnitts sehr schwach und wir stellen daher viele Behauptungen über Dinge auf, für die wir nicht wirklich jede Grundlage haben. Es wird eine Menge technischer Arbeit erfordern, um die empirische Stärke unserer Ergebnisse sorgfältig zu stärken. Ich denke, dass der Bewertung nicht genügend Aufmerksamkeit geschenkt wird.

Was hat sich im letzten Jahr in der Robotikforschung verändert und hat Ihrer Meinung nach zu den Fortschritten geführt, die Sie sich erhoffen?

Kuindersma: Aus meiner Sicht gibt es zwei wichtige Dinge, die meine Einstellung zur Arbeit in diesem Bereich verändert haben. Einer davon ist die Konvergenz des Feldes um wiederholbare Prozesse, um manipulative Fähigkeiten durch Demonstration zu trainieren. Die Pionierarbeit der Rundfunkpolitik (Dabei spielte TRI eine wichtige Rolle) ist eine wirklich mächtige Sache: Es nimmt den Prozess der Generierung von Manipulationsfähigkeiten auf, die zuvor im Grunde unergründlich waren, und verwandelt ihn in etwas, bei dem man einfach eine Menge Daten sammelt und sie auf einer Architektur trainiert, die zu diesem Zeitpunkt mehr oder weniger stabil ist , und Sie erhalten ein Ergebnis.

Der zweite Punkt ist alles, was in den an die Robotik angrenzenden Bereichen der KI passiert ist und zeigt, dass Umfang und Vielfalt der Daten tatsächlich der Schlüssel zu verallgemeinerbarem Verhalten sind. Wir hoffen, dass dies auch für die Robotik gilt. Durch die Kombination dieser beiden Dinge wird der Weg sehr klar, aber ich denke immer noch, dass es eine Menge offener Herausforderungen und Forschungsfragen gibt, die wir beantworten müssen.

Glauben Sie, dass Simulation eine effektive Möglichkeit ist, Daten für die Robotik zu skalieren?

Tedrake: Ich denke, dass die Leute Simulationen im Allgemeinen unterschätzen. Die von uns geleistete Arbeit hat mich hinsichtlich der Möglichkeiten der Simulation sehr optimistisch gestimmt, vorausgesetzt, wir nutzen sie mit Bedacht. Sich auf einen bestimmten Roboter zu konzentrieren, der eine bestimmte Aufgabe ausführt, bedeutet, die falsche Frage zu stellen. Sie müssen die Aufgabenzuteilung und -leistung in der Simulation ermitteln, um die Aufgabenzuteilung und -leistung in der realen Welt vorhersagen zu können. Es gibt einige Dinge, die immer noch schwer gut zu simulieren sind, aber selbst wenn es um Reibungskontakt und dergleichen geht, denke ich, dass wir an diesem Punkt ziemlich gut vorankommen.

Gibt es eine kommerzielle Zukunft für diese Partnerschaft, über die Sie sprechen können?

Kuindersma: Wir bei Boston Dynamics sind davon überzeugt, dass diese Arbeit einen langfristigen Geschäftswert hat, und das ist einer der Hauptgründe, warum wir in sie investieren wollen. Aber das Ziel dieser Zusammenarbeit liegt in Wirklichkeit in der Grundlagenforschung: sicherzustellen, dass wir die Arbeit machen, die Wissenschaft voranbringen und sie auf eine Art und Weise tun, die streng genug ist, dass wir die Ergebnisse tatsächlich verstehen und ihnen vertrauen und sie der Welt mitteilen können. . Also ja, wir sehen dort einen enormen Geschäftswert. Ja, wir kommerzialisieren Atlas, aber bei diesem Projekt geht es eigentlich um Grundlagenforschung.

Was passiert als nächstes?

Tedrake: Es gibt Fragen an der Schnittstelle zwischen den Dingen, die BD getan hat, und den Dingen, die TRI getan hat, die wir gemeinsam tun müssen, um anzufangen, und die die Dinge voranbringen werden. Und dann haben wir große Ambitionen: Das Ziel besteht darin, eine allgemeine Fähigkeit zu erhalten, die wir LBM (große Verhaltensmodelle) nennen und die auf Atlas läuft. Im ersten Jahr versuchen wir, uns auf diese grundlegenden Fragen zu konzentrieren, Grenzen zu überschreiten und Artikel zu schreiben und zu veröffentlichen.

Ich möchte, dass die Menschen unsere Ergebnisse mit Begeisterung beobachten, und ich möchte, dass sie unseren Ergebnissen vertrauen, wenn sie sie sehen. Für mich ist dies die wichtigste Botschaft für die Robotik-Community: Durch diese Partnerschaft versuchen wir, eine längerfristige Vision zu haben, die unseren extremen Optimismus und unseren kritischen Ansatz in Einklang bringt.

Aus den Artikeln auf Ihrer Website

Verwandte Artikel im Internet

By rb8jg

Leave a Reply

Your email address will not be published. Required fields are marked *