Google Gemini – jak wygląda przyszłość AI od spółki Alphabet?
W tym artykule dowiesz się:
- Czym Google Gemini wyróżnia się od ChatuGPT
- W jakich wersjach dostępne jest Google Gemini
- Jakie języki programowania zna Google Gemini
- Jaki wpływ Google Gemini może mieć na przyszłość AI
Wszyscy znają ChatGPT, ale nie jest on jedynym dużym modelem językowym na rynku AI. Swoje działania w tym obszarze prowadzi także spółka Alphabet, do której należą m.in. produkty Google. W grudniu 2023 roku na rynku pojawił się Google Gemini, model AI, który może solidnie namieszać w całym sektorze.
Czym jest Google Gemini i jakie są jego główne cechy?
Rok 2023 był rokiem sztucznej inteligencji – opracowany przez OpenAI ChatGPT odmienił wiele branż, w tym sektor IT i choć minie jeszcze wiele czasu, zanim AI zastąpi programistów, nie zmienia to faktu, że z powodu AI miały już miejsce masowe lay-offy. I choć to OpenAI i Microsoft, który zainwestował w tę organizację, wysunęły się na prowadzenie w wyścigu AI, inni technologiczni giganci, tacy jak Amazon, Apple czy Meta pracują nad swoimi dużymi modelami językowymi, które z mniejszym bądź większym sukcesem wdrażają.
Na boisku jest jednak jeszcze jeden poważny gracz – jest nim Google, a dokładnie spółka Alphabet, do której należą wszystkie produkty i marki związane z Google. Nie tylko jest ona monopolistą w dziedzinie wyszukiwania (chociaż Microsoft Bing po połączeniu z ChatGPT zaczął podgryzać pozycje Google’a), ale również ma spore osiągnięcia w dziedzinie sztucznej inteligencji – mowa m.in. o projektach takich jak Google Deep Mind czy Google Research. 6 grudnia 2023 roku dołączył do nich Google Gemini.
Google Gemini to największy i najpotężniejszy duży model językowy opracowany przez Google. Podobnie jak ChatGPT-4 ma być multimodalny, co oznacza, że będzie w stanie nie tylko interpretować zdjęcia, tekst czy kod, ale również generalizować na ich podstawie oraz wyciągać wnioski z wprowadzonych danych. Google twierdzi, że Gemini ma być lepszy od ChatGPT i nie są to czcze przechwałki – w testach z rozumienia tekstu, interpretacji obrazu czy rozumowania nie tylko osiągał lepsze wyniki niż flagowy produkt OpenAI, ale także w niektórych aspektach przewyższał ludzkich ekspertów.
Jakie są potencjalne zastosowania Google Gemini?
Autorzy Google Gemini twierdzą, że znajdzie on zastosowanie w praktycznie każdej branży. Potwierdzeniem tej tezy ma być fakt, że jest on dostępny w trzech, różniących się mocą obliczeniową oraz przeznaczeniem, wersjach:
- Gemini Ultra powstał z myślą o wysoce złożonych zadaniach, takich jak projekty badawcze czy analiza dużych zbiorów danych. Ma sprawdzić się wszędzie tam, gdzie potrzeba potężnej mocy obliczeniowej, czyli np. w finansach, nauce czy medycynie.
- Gemini Pro to uniwersalne i wszechstronne rozwiązanie, które stawia przede wszystkim na wydajność, a nie dużą moc obliczeniową, dzięki czemu można je stosować w codziennej pracy np. do tworzenia chatbotów, automatyzacji czy wsparciu w migracji do chmury.
- Gemini Nano jest najmniejszą wersją, dopasowaną zastosowaniem i mocą obliczeniową do urządzeń mobilnych, w których może pomóc np. w rozpoznawaniu mowy.
Google Gemini ma również pomagać developerom w programowaniu, tym bardziej że zna Pythona, Javę, C++ i Go. Może być też stosowany w marketingu – od płatnych reklam w Google Ads po pomoc w tworzeniu treści na firmowe blogi. Twórcy Gemini twierdzą też, że będzie on w stanie tłumaczyć teksty i wspierać proces kreatywny. Nowy duży model językowy spółki Alphabet ma także pomóc w przetwarzaniu i analizie różnorodnych danych – od tekstu, przez formularze kalkulacyjne po wykresy i mapy.
Sposób działania Google Gemini i jego dostępność w trzech różnych wersjach sprawiają, że w już niedalekiej przyszłości może on stać się codziennością w branżach, takich jak medycyna, marketing czy IT. Może także odmienić obsługę klienta w wielu sektorach, ponieważ pozwala tworzyć wyspecjalizowane chatboty.
Jakie są wyzwania związane z implementacją i skalowaniem Google Gemini?
Chociaż możliwości Google Gemini mogą imponować zarówno laikom, jak i specjalistom w dziedzinie AI, jego premiera wiąże się z wieloma wyzwaniami. Przede wszystkim, ze względu na przepisy dotyczące bezpieczeństwa i prywatności danych, nie jest dostępny w krajach Unii Europejskiej.
Kolejnym wyzwaniem związanym z implementacją i skalowaniem Google Gemini jest fakt, że model ten – ze względu na swoje możliwości – potrzebuje nie tylko ogromnej ilości przestrzeni dyskowej i mocy operacyjnej (do działania wykorzystuje specjalnie opracowane Cloud TPU v5p, TPU to skrót od tensor processing unit), ale także potężnych ilości energii elektrycznej – według badań przeprowadzonych przez Vrije University w Amsterdamie, jeśli ogólne zapotrzebowanie na AI utrzyma się na takim samym poziomie jak w 2023 roku, to już w 2027 roku centra danych niezbędne do działania SI będą zużywać ponad 85 terwatogodzin energii elektrycznej rocznie, czyli więcej niż niektóre małe kraje (Czechy w 2021 roku zużyły 61 TWh).
Wyzwaniem dla najświeższej innowacji Google może być też trudność w faktycznym dostarczeniu obiecywanych możliwości. Jak zauważyli dziennikarze m.in. Bloomberga czy Business Insider, Google może wprowadzać użytkowników w błąd odnośnie do zdolności Gemini. Przemawiać ma za tym fakt, że w trakcie prezentacji Gemini nie odpowiadał w czasie rzeczywistym, a testów bencharkowych potwierdzających jakość odpowiedzi Gemini nie wykonali niezależni eksperci.
Jakie są potencjalne korzyści i wpływ Google Gemini na przyszłość AI?
Jeżeli zapowiadane przez spółkę Alphabet możliwości Google Gemini okażą się prawdą, nowy model językowy będzie rewolucją na rynku AI. Największą korzyścią ma być eliminacja halucynacji, czyli sytuacji, w których SI generuje odpowiedź pełną zmyśleń i przekłamań, ale tak, żeby wydawała się ona poprawna. Wciąż jest to jeden z największych problemów obecnie stosowanych LLM, a organizacja, która rozwiąże go jako pierwsza, może stać się liderem rynku.
Wrażenie robią też multimodalne zdolności Gemini oraz zapowiadane trzy wersje, które mogą mieć mniejsze zapotrzebowanie obliczeniowe i energetyczne niż ChatGPT. Jeśli tak się stanie, może dojść do niezwykłego postępu technologicznego, nie tylko w obszarze AI, ale również w branżach korzystających z tego typu narzędzi. Gemini może odmienić oblicze automatyzacji przemysłu, projektowania doświadczenia użytkownika czy personalizacji np. oferty produktowej.
Należy też zauważyć słonia w menażerii – nie można wykluczyć, że Google Gemini będzie milowym krokiem w rozwoju AI. ChatGPT czy Google Bard (wcześniejsze dokonanie Google w dziedzinie AI) mogą imponować swoimi zdolnościami, ale wciąż są tylko bardzo zaawansowanymi programami, które świetnie sprawdzają się w dziedzinach, do których zostały zaprojektowane, ale są prawie całkowicie bezużyteczne w innych. Jeśli możliwości Gemini potwierdzą się, jego kolejne wersje mogą doprowadzić do powstania silnej (tj. posiadającej zdolności intelektualne człowieka i wszystkie atrybuty jego umysłu) sztucznej inteligencji, a w dalszej przyszłości może nawet przewyższającej ludzkie możliwości superinteligencji. Czy tak będzie? Czas pokaże.
Porozmawiajmy!
a my pomożemy Ci wdrożyć najnowsze rozwiązania!