Boty pozwalają ChatGPT dotknąć prawdziwego świata dzięki Microsoft

W zeszłym tygodniu badacze Microsoftu ogłaszać Eksperymentalna struktura do kontrolowania robotów i dronów przy użyciu możliwości językowych ChatGPT, popularnego modelu języka sztucznej inteligencji stworzonego przez OpenAI. Korzystając z poleceń języka naturalnego, ChatGPT może pisać specjalny kod, który kontroluje ruchy bota. Następnie człowiek wyświetla wyniki i dostosowuje się w razie potrzeby, aby zadanie zakończyło się pomyślnie.

Badania ukazały się w artykule zatytułowanym „ChatGPT dla botów: Zasady projektowania i możliwości modeluNapisane przez Sai Vempralę, Rogerio Bonattiego, Arthura Buckera i Ashisha Kapoora z Microsoft Autonomous Systems and Robotics Group.

W Film wyjaśniającyMicrosoft pokazuje boty — najwyraźniej kontrolowane przez kod napisany przez ChatGPT i wykonujący instrukcje człowieka — wykorzystujące ramię robota do układania bloków w logo Microsoft, pilotowanie drona w celu zbadania zawartości półki lub znajdowanie przedmiotów za pomocą bota z funkcjami wizyjnymi.

Film demonstracyjny „ChatGPT dla botów” firmy Microsoft.

Aby umożliwić ChatGPT interakcję z botami, badacze nauczyli ChatGPT niestandardowego API botnetu. Po otrzymaniu instrukcji, takich jak „złap piłkę”, ChatGPT może wygenerować kod do sterowania botem, tak jak napisałby wiersz lub ukończył artykuł. Po sprawdzeniu i edycji kodu przez człowieka pod kątem dokładności i bezpieczeństwa, operator-człowiek może wykonać zadanie i ocenić jego wydajność.

W ten sposób ChatGPT przyspiesza programowanie sterowania automatycznego, ale nie jest systemem niezależnym. „Podkreślamy, że korzystanie z ChatGPT dla botów nie jest w pełni zautomatyzowanym procesem”, stwierdzają badania, „ale raczej służy jako narzędzie do zwiększania ludzkich możliwości”.

Zbliżenie / Diagram dostarczony przez firmę Microsoft wyjaśniający, jak działa ChatGPT for Robotics.

Microsoftu

Podczas gdy większość informacji zwrotnych do ChatGPT (pod względem sukcesu lub porażki jego działań) wydaje się pochodzić od ludzi w formie tekstu, badacze twierdzą również, że odnieśli pewien sukces w przekazywaniu danych wizualnych do samego ChatGPT. W jednym z przykładów naukowcy przydzielili ChatGPT polecenie botowi złapania piłki do koszykówki na podstawie informacji zwrotnych z kamery: „ChatGPT może oszacować wygląd piłki i nieba na obrazie z kamery za pomocą kod SVG. To zachowanie wskazuje na możliwość, że LLM podąża za niejawnym modelem świata, który wykracza poza możliwości oparte na tekście. „

READ iSIM, AR, 5G i inne ogłoszenia MWC, o których fani Apple powinni wiedzieć

Chociaż wyniki wydają się w tej chwili prymitywne, reprezentują wczesne próby zastosowania najnowszej technologii epoki – dużych paradygmatów językowych – do automatycznego sterowania. Według Microsoftu interfejs ChatGPT może w przyszłości otworzyć boty dla znacznie szerszej publiczności.

„Naszym celem w tych badaniach jest sprawdzenie, czy ChatGPT może myśleć poza tekstem, rozumować w świecie fizycznym, aby pomóc w zadaniach botów” – mówi badanie przeprowadzone przez firmę Microsoft. post na blogu. „Chcemy ułatwić ludziom interakcję z robotami, bez konieczności uczenia się skomplikowanych języków programowania lub szczegółów dotyczących systemów robotycznych”.

Konrad Borkowski

Konrad Borkowski jest autorem serwisu Biotworzywa.com.pl, gdzie zajmuje się tworzeniem przystępnych i rzetelnych materiałów dotyczących aktualnych wydarzeń z kraju i ze świata. W swoich tekstach porusza tematy związane z polityką, gospodarką, technologią, sportem, kulturą i stylem życia. Koncentruje się na jasnym przekazie, użytecznych informacjach i historiach istotnych dla czytelników. Jego celem jest dostarczanie czytelnikom aktualnych, przejrzystych i angażujących treści.

Google Translate przechodzi największą metamorfozę od lat. Aplikacja na Androida z nowym wyglądem

Google One z AI tanieje. Firma obniża ceny i zwiększa przestrzeń na dane

mObywatel z nową wyszukiwarką. Wystarczy wpisać jedno słowo

Google Translate przechodzi największą metamorfozę od lat. Aplikacja na Androida z nowym wyglądem

Samsung szykuje nie tylko nowy zegarek. Galaxy Watch Ultra 2 i tajemniczy Galaxy Able nadchodzą

Były twórca Halo ujawnia kulisy pracy w Xboxie: „To był absurdalny pomysł”

Google One z AI tanieje. Firma obniża ceny i zwiększa przestrzeń na dane

Dodaj komentarz Anuluj pisanie odpowiedzi

More Stories

Google Translate przechodzi największą metamorfozę od lat. Aplikacja na Androida z nowym wyglądem

Google One z AI tanieje. Firma obniża ceny i zwiększa przestrzeń na dane

mObywatel z nową wyszukiwarką. Wystarczy wpisać jedno słowo

You may have missed

Google Translate przechodzi największą metamorfozę od lat. Aplikacja na Androida z nowym wyglądem

Samsung szykuje nie tylko nowy zegarek. Galaxy Watch Ultra 2 i tajemniczy Galaxy Able nadchodzą

Były twórca Halo ujawnia kulisy pracy w Xboxie: „To był absurdalny pomysł”

Google One z AI tanieje. Firma obniża ceny i zwiększa przestrzeń na dane