Während das autonome Fahren bei der Routenplanung und Erkennung von Objekten schon lange auf maschinellem Lernen basiert, setzen einige Unternehmen und Forscher nun darauf, dass generative KI – Modelle, die Daten über ihre Umgebung sammeln und Vorhersagen erstellen – dabei helfen wird, die Eigenständigkeit auf die nächste Stufe zu heben. Wayve, ein Konkurrent von Waabi, brachte letztes Jahr ein vergleichbares Modell auf den Markt, das auf von seinen Fahrzeugen gesammelten Videos trainiert wird.
Waabis Modell funktioniert ähnlich wie Bild- oder Videogeneratoren wie DALL-E und Sora von OpenAI. Es nimmt Punktwolken aus Lidar-Daten, die eine 3D-Karte der Fahrzeugumgebung visualisieren, und teilt sie in Teile auf, auf die gleiche Weise, wie Bildgeneratoren Fotos in Pixel aufteilen. Basierend auf seinen Trainingsdaten sagt Copilot4D dann voraus, wie sich alle Punkte in den LIDAR-Daten bewegen werden. Dadurch ist es möglich, Vorhersagen für 5 bis 10 Sekunden in der Zukunft zu erstellen.
Waabi ist eines der wenigen selbstfahrenden Unternehmen, darunter die Konkurrenten Wayve und Ghost, die ihren Ansatz als „KI zuerst“ bezeichnen. Für Urtasun bedeutet dies, ein System zu entwerfen, das aus Daten lernt, und nicht eines, das lernen muss, auf bestimmte Situationen zu reagieren. Die Kohorte setzt darauf, dass ihre Methoden weniger Stunden für Straßentests selbstfahrender Autos erfordern könnten, ein kontroverses Thema nach einem Unfall im Oktober 2023, bei dem ein Cruise-Robotaxi einen Fußgänger in San Francisco mitzerrte.
Waabi hebt sich von seinen Mitbewerbern ab, indem es ein generatives Modell für Lidar statt für Kameras entwickelt.
„Wenn Sie ein Level-4-Spieler werden wollen, ist Lidar ein Muss“, sagt Urtasun und bezieht sich auf den Grad der Automatisierung, bei dem das Auto nicht die Aufmerksamkeit eines Menschen erfordert, um sicher zu fahren. Die Kameras zeigen gut, was das Auto sieht, aber sie sind nicht so gut darin, Entfernungen zu messen oder die Geometrie der Umgebung des Autos zu verstehen, sagt sie.