Unterstützung von A.I.Sprachmodelle, Googles Roboter werden schlauerer (2024)

Werbung überspringen

Unterstützt durch

Werbung überspringen

Die Verschiebung

Unser Geschmack des neuen Robotermodells von Google, RT-2, das künstliche Intelligenz-Technologie mit Robotern kombiniert.

TypKevin Roose

Kevin Roose ist ein technologischer Kolumnist und Co-Moderator des Podcasts Times "Harte Gabel. „“

28 juli 2023

Vor einem Tisch befand sich ein mit einem Waffen ausgestatteter Roboter.Es gab drei Plastikstatuetten auf dem Tisch: einen Löwen, einen Wal und einen Dinosaurier.

Ein Ingenieur gab dem Roboter eine Anweisung: "Nimm das ausgestorbene Tier auf."

Der Roboter summte einen Moment, dann streckte sich sein Arm aus und seine Klaue öffnete sich und fiel herunter.Es griff nach dem Dinosaurier.

Bis vor kurzem war diese Demonstration, von der ich letzte Woche während eines Podcast -Interviews in der Robotics Division von Google in Mountain View, Kalifornien, miterlebt habe, unmöglich gewesen.Roboter konnten nicht zuverlässig Objekte manipulieren, die sie noch nie gesehen hatten, und sie konnten den logischen Sprung vom 'ausgestorbenen Tier' zum 'Plastikdinosaurier' sicherlich nicht machen.

Geholpen door A.I. Taalmodellen, de robots van Google worden steeds slimmer (3)

Aber es gibt eine stille Revolution in der Robotik, die zu den jüngsten Entwicklungen in SO -erner folgtTolle Sprachmodelle- Die gleiche Art von künstlichen Intelligenzsystem, das angetrieben wirdChatgpt, Bard und andere Chatbots.

Google hat kürzlich angefangen, hochmoderne Sprachmodelle in seinen Robotern einzuschließen, was ihnen das Äquivalent künstlicher Gehirne verleiht.Das mysteriöse Projekt hat die Roboter viel intelligenter gemacht und ihnen ein neues Konzept der Konzepte und der Problemlösungskapazität gegeben.

Ich habe einen Einblick in diesen Fortschritt während einer privaten Demonstration des neuesten Robotermodells von Google mit dem Namen RT-2 erhöht.Das am Freitag vorgestellte Modell ist ein erster Schritt in die Richtung dessen, was die Manager von Google als großer Sprung nach vorne beschreiben, wenn Roboter aufgebaut und programmiert werden.

"Wir mussten unser gesamtes Forschungsprogramm aufgrund dieser Änderung überdenken", sagt Vincent Vanhoucke, Leiter von Robotik bei Google Deepmind."Viele der Dinge, an denen wir zuvor gearbeitet haben, wurden für völlig ungültig erklärt."

Bild

Roboter gehen auf dem Gebiet der Beweglichkeit auf menschlicher Ebene immer noch zu kurz und scheitern bei einigen grundlegenden Aufgaben, aber die Verwendung von A.I.Sprachmodelle, um Robotern neue Fähigkeiten des Denkens und Improvisation zu vermitteln, ist ein vielversprechender Durchbruch, sagte Ken Goldberg, Professor für Robotik an der University of California in Berkeley.

"Was sehr beeindruckend ist, ist, wie die semantischen Links zu Robotern", sagte er."Das ist sehr aufregend für Robotik."

Um die Größe davon zu verstehen, hilft es, etwas darüber zu wissen, wie Roboter konventionell aufgebaut werden.

Jahrelang haben Ingenieure von Google und anderen Unternehmen Roboter geschult, um eine mechanische Aufgabe auszuführen - beispielsweise einen Hamburger -, indem sie sie mit einer bestimmten Liste von Anweisungen programmieren.(Senken Sie den Spatel 6,5 Zoll, schieben Sie ihn nach vorne, bis er Widerstand erfährt, heben Sie ihn für 4,2 Zoll an, drehen Sie ihn 180 Grad usw.) Roboter praktizierten und praktizierten dann immer wieder die Aufgaben, wobei die Ingenieure ihn jedes Mal anpassen, bis sie korrekt ist.

Dieser Ansatz funktionierte für bestimmte begrenzte Anwendungen.Aber Roboter auf diese Weise ist langsam und arbeitsintensiv.Es erfordert die Erfassung vieler Daten aus realen Tests.Und wenn Sie lernen wollten, einen Roboter zu machen, um etwas Neues zu tun - zum Beispiel einen Pfannkuchen anstelle eines Hamburgers, mussten Sie ihn normalerweise vollständig programmieren.

Teilweise aufgrund dieser Einschränkungen haben sich die Hardware -Roboter schneller verbessert als ihre Software -basierten Brüder und Schwestern.Openai, der Hersteller von Chatgpt,Befriedigte sein Robotik -Team2021 bezog sich der langsame Fortschritt und einen Mangel an Schulungsdaten mit hoher Qualität.Im Jahr 2017 die Muttergesellschaft von Google, Alphabet,Boston Dynamics verkauft, eine Roboterfirma, die das japanische Technologiekonglomerat Softbank übernommen hatte.(Boston Dynamics ist jetzt im Besitz von Hyundai und scheint insbesondere zu existierenproduzieren virale Videosvon menschlichen Robotern, die beängstigende Agilitätsleistung liefern.)

Bild

Forscher von Google hatten in den letzten Jahren eine Idee.Was ist, wenn Roboter, anstatt einzeln für bestimmte Aufgaben programmiert zu werden, ein A.I.Sprachmodell - ein Modell, das auf riesige Mengen an Internettext geschult wurde -, um neue Fähigkeiten für sich selbst zu erlernen?

"Wir haben vor ungefähr zwei Jahren angefangen, mit diesen Sprachmodellen zu spielen, und dann haben wir festgestellt, dass sie viel Wissen haben", sagt Karol Hausman, ein Google -Forscher.„Also haben wir angefangen, sie mit Robotern zu verbinden. „“

Der erste Versuch von Google, Sprachmodelle und physikalische Roboter zu verschmelzen, war ein Forschungsprojekt namens Palm-Saycan, das letztes Jahr enthüllt wurde.Eserregte etwas Aufmerksamkeit, aber die Nützlichkeit war begrenzt.Die Roboter verpassten die Fähigkeit, Bilder zu interpretieren - eine entscheidende Fähigkeit, wenn Sie möchten, dass sie durch die Welt navigieren können.Sie konnten Schritt -durch -Step -Anweisungen für verschiedene Aufgaben aufschreiben, aber sie konnten diese Schritte nicht in Aktionen umwandeln.

Das neue Robotermodell von Google, RT-2, ist genau möglich.Es ist das, was das Unternehmen als "Vision-Sprach-Aktion" -Modell oder ein A.I.System, das nicht nur die Welt um ihn herum sehen und analysieren kann, sondern auch einem Roboter sagen kann, wie er sich bewegen kann.

Dies geschieht, indem die Bewegungen des Roboters in eine Reihe von Zahlen umgesetzt werden - einen Prozess namens Tokenisierung - und diese Token in dieselben Trainingsdaten wie das Sprachmodell.Letztendlich, so wie Chatgpt oder Bard lernt zu erraten, welche Wörter danach in einem Gedicht oder in einer Geschichte kommen sollten, kann RT-2 lernen, zu erraten, wie der Arm eines Roboters sich bewegen sollte, um einen Ball oder eine leere Dose Soda in den Wirf einen Müll.Behälter.

"Mit anderen Worten, dieses Modell kann lernen, Roboter zu sprechen", sagte Mr.Hausman.

Während einer einstündigen Demonstration, die in einer Google Office-Küche stattfand, die mit Objekten aus einem Dollargeschäft übersät war, führten mein Co-Moderator des Podcasts und ich RT-2 eine Reihe beeindruckender Aufgaben aus.Man folgte erfolgreich komplexe Anweisungen wie "Bewegen Sie das Volkswagen in die deutsche Flagge", die RT-2 durch das Finden und Halten eines Modells für VW und ein paar Meter entfernt auf eine Miniaturflagge fand und hielt.

Bild

Es stellte sich auch heraus, dass es in der Lage war, Anweisungen in anderen Sprachen als Englisch zu befolgen und sogar abstrakte Verbindungen zwischen verwandten Konzepten herzustellen.Als ich einmal wollte, dass das RT-2 einen Fußball abholte, befahl ich ihm, Lionel Messi abzuholen.RT-2 hatte beim ersten Versuch einen guten Versuch.

Der Roboter war nicht perfekt.Es identifizierte den Geschmack einer Dose Lacroix, die zuvor auf den Tisch gelegt wurde, fälschlicherweise.(Die Dose war Zitrone; RT-2 erraten orange.) Ein anderes Mal, als gefragt wurde, welche Art von Frucht auf einem Tisch stand, antwortete der Roboter einfach: "Weiß".(Es war eine Banane.) Eine Google -Sprecherin sagte, dass der Roboter auf die Frage eines früheren Tester eine Antwort im Cache verwendet habe, weil das WLAN gerade ausgestiegen war.

Geholpen door A.I. Taalmodellen, de robots van Google worden steeds slimmer (4)

Google hat keine unmittelbaren Pläne, RT-2-Roboter zu verkaufen oder sie in größerem Maßstab zu veröffentlichen, aber die Forscher glauben, dass diese neuen Maschinen letztendlich für mehr als nur Salontricks nützlich sein werden.Roboter mit gebauten Sprachmodellen können in Lagern platziert werden, können in der Medizin verwendet oder sogar als Haushaltshelfer verwendet werden - das Wachs faltet, den Geschirrspüler entladen, das Haus aufräumt, sagten sie.

"Dies macht es wirklich möglich, Roboter in Umgebungen zu verwenden, in denen Menschen sind", sagte Heer Vanhoucke."In Büroumgebungen, in häuslichen Umgebungen, an allen Orten, an denen viele physische Aufgaben ausgeführt werden müssen."

Natürlich ist es schwieriger, Objekte in der chaotischen, chaotischen physischen Welt zu bewegen als in einem kontrollierten Labor.Und seit A.I.Sprachmodelle machen oft Fehler oder kommen unsinnige Antworten - was Forscher nennenHalluzinationOder Konfabulation - seine Verwendung, wenn das Gehirn der Roboter neue Risiken mit sich bringen kann.

Aber Herr Goldberg, Professor in Berkeleys Robotik, sagte, diese Risiken seien immer noch klein.

"Wir sprechen nicht davon, diese Dinge zu veröffentlichen", sagte er."In diesen Laborumgebungen versuchen sie nur, einige Objekte auf einen Tisch zu schieben."

Geholpen door A.I. Taalmodellen, de robots van Google worden steeds slimmer (5)

Google seinerseits sagte, RT-2 sei mit zahlreichen Sicherheitsfunktionen ausgestattet.Zusätzlich zu einem großen roten Taste auf der Rückseite jedes Roboters - der den Roboter beim Drücken stoppt - verwendet das System Sensoren, um zu verhindern, dass er mit Menschen oder Objekten zusammenfasst.

Die in RT-2 eingebaute KI-Software verfügt über einen eigenen Schutz, mit dem sie verhindern können, dass der Roboter etwas Schädliches tut.Ein gutes Beispiel: Googles Roboter können geschult werden, um Behälter nicht mit Wasser zu nehmen, da Wasser ihre Hardware schädigen kann, wenn es verschüttet wird.

Wenn Sie die Art von Person sind, die sich Sorgen um A.I.Schurstaten - und Hollywood haben uns genügend Gründe gegeben, um dieses Szenario zu befürchten, vom ursprünglichen "Terminator" bis zum "M3gan" des letzten Jahres - die Idee, Roboter zu machen, die im laufend Idee.

Aber bei Google ist es die Art von Idee, die Forscher feiern.Nach Jahren in der Wildnis sind Hardware -Roboter zurück - und sie schulden ihr ihrem Chatbot -Gehirn.

Kevin Rooseist ein technologischer Kolumnist und Autor von "Future Proof: 9 Regeln für Menschen im Zeitalter der Automatisierung". Mehr über Kevin Roose

Eine Version dieses Artikels erscheint in gedruckter Form auf, Abschnitt

, Seite

Aus der New York Edition

Mit der Überschrift:

Mit Hilfe von A.I.Die Roboter von Google sind schlau.Nachdrucke bestellen|Die heutige Zeitung|Abonnieren

Werbung überspringen