Od ponad roku Google ściga się, aby zbudować technologię, która będzie w stanie sprostać ChatGPT, otwierającemu oczy chatbotowi oferowanemu przez startup OpenAI z San Francisco zajmujący się sztuczną inteligencją.
W środę technologiczny gigant zrobił kolejny krok w trwającym wyścigu, uruchamiając nową wersję swojego chatbota Google Bard. Zaktualizowany bot jest dostępny od razu dla osób anglojęzycznych w ponad 170 regionach i krajach, w tym w USA, i jest oparty na nowej technologii sztucznej inteligencji o nazwie Gemini, którą firma rozwija od początku roku.
„To początek ery Bliźniąt” – powiedział w wywiadzie dyrektor generalny Google, Sundar Pichai. „To realizacja wizji, jaką mieliśmy, tworząc Google DeepMind, firmowe laboratorium sztucznej inteligencji. W nadchodzących miesiącach Google wprowadzi trzy różne wersje tej technologii w szerokiej gamie produktów i usług” – powiedział.
Gemini jest potężniejszy niż poprzednie technologie chatbotów Google i może generować dokładniejsze odpowiedzi, a w niektórych sytuacjach nawet zbliżyć się do naśladowania ludzkiego rozumowania, twierdzą Pichai i Demis Hassabis, kierujący Google DeepMind.
„Jesteśmy bardzo zadowoleni z wyników Gemini” – powiedziała dr Hassabis.
Kiedy pod koniec zeszłego roku OpenAI zadziwiło świat chatbotem ChatGPT opartym na sztucznej inteligencji, Google był oszołomiony. Gigant technologiczny spędził lata na opracowywaniu podobnej technologii, ale podobnie jak inni giganci technologiczni – w szczególności Meta – niechętnie wypuszczał technologię, która mogłaby generować stronnicze, fałszywe lub toksyczne informacje.
W marcu Google uruchomił swojego chatbota Bard, który zbiera średnie recenzje. Miesiąc później firma ogłosiła, że połączyła swoje dwa laboratoria sztucznej inteligencji – Google Brain i DeepMind – skupiając ponad 2000 badaczy i inżynierów. W maju podczas przełomowej konferencji Google I/O ogłoszono, że nowe laboratorium Google DeepMind rozpoczęło prace nad układem Gemini.
Po założeniu Brain Lab w 2011 r. Google przejął DeepMind w 2014 r., płacąc 650 mln dolarów za londyński start-up zajmujący się sztuczną inteligencją. Przez dekadę DeepMind działał w dużej mierze niezależnie od Brain Lab i reszty Google, a nawet próbował opuścić firmę w 2017 r. Jednak gdy Google miał trudności z dogonieniem OpenAI, pan Pichai połączył oba laboratoria pod kierownictwem dr Hassabisa, specjalisty ds. neurobiolog, współzałożyciel DeepMind.
Google opublikowało wyniki testów porównawczych, w których stwierdzono, że najpotężniejsza wersja Gemini przewyższa najnowszą technologię OpenAI, GPT-4, w kilku kluczowych obszarach. Pichai stwierdził, że lepiej radzi sobie z generowaniem kodów komputerowych niż poprzednie techniki Google i może dokładniej podsumowywać artykuły prasowe i inne dokumenty tekstowe.
Gemini jest również przeznaczony do analizowania obrazów i dźwięków, ale umiejętności te zostaną włączone do chatbota Barda dopiero później.
Google stworzył trzy wersje Gemini z trzema różnymi zestawami umiejętności. Największy, Ultra, przeznaczony jest do wykonywania skomplikowanych zadań i zadebiutuje w przyszłym roku. Pro, oferta średniego poziomu, zostanie wdrożona w kilku usługach Google od środy za pomocą chatbota Bard. Mniejsza wersja Nano będzie od środy obsługiwać niektóre funkcje smartfona Pixel 8 Pro, takie jak podsumowywanie nagrań dźwiękowych i oferowanie sugerowanych odpowiedzi tekstowych w WhatsApp.
Gemini to to, co naukowcy nazywają dużym modelem językowym (LLM) – złożonym systemem matematycznym, który może uczyć się umiejętności poprzez analizę ogromnych ilości danych, w tym książek cyfrowych, artykułów w Wikipedii i internetowych tablic ogłoszeniowych. Identyfikując wzorce w całym tym tekście, LLM uczy się samodzielnie tworzyć tekst. Oznacza to, że może pisać artykuły naukowe, tworzyć kod komputerowy, a nawet prowadzić rozmowę.
Za pośrednictwem Gemini Google przeszkolił także technologię w zakresie cyfrowych obrazów i dźwięków. Naukowcy nazywają to systemem „multimodalnym”, co oznacza, że może on analizować obrazy i dźwięki i reagować na nie. Jeśli na przykład zadasz mu zadanie matematyczne obejmujące linie, kształty i inne obrazy, może odpowiedzieć w ten sam sposób, w jaki zrobiłby to uczeń szkoły średniej.
Jednak ta technologia będzie dostępna dla konsumentów dopiero w przyszłym roku. Google przyznał również, że Gemini, podobnie jak podobne systemy, jest podatny na błędy. Potrafi mylić fakty lub nawet mieć „halucynacje” – zmyśla.
Google Cloud, który świadczy usługi AI i obliczeniowe innym firmom, chętnie udostępnia klientom Gemini, konkurując o umowy z OpenAI i Microsoft. Po tym, jak w zeszłym miesiącu OpenAI na krótko zmusiło Sama Altmana, swojego dyrektora generalnego, do rezygnacji, pozostawiając firmę w zawieszeniu, Google Cloud stworzył plan migracji, próbując podkraść klientów swojego rywala.
Klienci mogą płacić Google tę samą cenę, co ich aktualna cena OpenAI i otrzymywać środki w chmurze lub rabaty.
Google twierdzi, że klienci korzystający z chmury będą mieli dostęp do Gemini Pro – oferty średniego poziomu – od 13 grudnia. Pichai powiedział, że niektórzy nieznajomi testują teraz Gemini Ultra – najpotężniejszą wersję tej technologii.
Chociaż Google przez ostatni rok walczył o odzyskanie pozycji lidera w dziedzinie sztucznej inteligencji z rąk OpenAI, Pichai stwierdził, że na rynku jest wystarczająco dużo miejsca dla wszystkich dostawców sztucznej inteligencji.
„To daleko od gry o sumie zerowej” – stwierdził Pichai. „Jesteśmy podekscytowani tym, co wprowadzamy na rynek. Zdajemy sobie również sprawę, że to dopiero początek, ponieważ w dalszych działaniach widzimy postęp, jaki robimy.
More Stories
Ta ładowarka GaN o mocy 100 W jest cienka i składana
Kuo: Aktualizacja pamięci RAM do 12 GB w przyszłym roku będzie ograniczona do iPhone’a 17 Pro Max
Verdansk w końcu powraca do Call of Duty Warzone, a fani są z tego powodu zadowoleni