Zaledwie dwa dni temu świat technologiczny huczał od plotek o opóźnieniu debiutu bardzo oczekiwanego przez Google dużego modelu językowego AI. Rzekomo decyzję o przesunięciu daty premiery Gemini podjął sam CEO - Sundar Pichai. Wbrew tym spekulacjom, Pichai zaskoczył dziś branżę wypuszczając Gemini 1.0, który określił jako "najbardziej efektywny i inteligentny model kiedykolwiek zbudowany przez Google."

Reklama

Gemini od Google to efekt wspólnych wysiłków zespołów z całej firmy, w tym Google Research. Ten multimodalny model, podobny do swojego bezpośredniego konkurenta GPT-4, może przetwarzać i integrować różne typy danych, w tym tekst, kod, audio, obrazy i wideo.

Seria Gemini będzie dostępna w trzech wersjach: Ultra, Pro i Nano. Szczególnie godna uwagi jest sama wydajność modelu. Wariant Ultra pobił obecne czołowe generatywne AI w 30 z 32 powszechnie używanych akademickich testów porównawczych dla dużych modeli językowych. Co godne uwagi, Gemini 1.0 Ultra uzyskało 90 proc. w teście MMLU (massive multitask language understanding), przewyższając ekspertów ludzkich. Test ten wykorzystuje kombinację 57 przedmiotów, w tym matematyki, fizyki, historii, prawa, medycyny i etyki, aby ocenić zarówno wiedzę o świecie, jak i umiejętności rozwiązywania problemów.

Z kolei w teście MMMU (Massive Multi-discipline Multimodal Understanding), Gemini 1.0 Ultra przewyższył GPT-4V (GPT-4 Vision), osiągając wynik o 3 proc. wyższy niż model OpenAI.

Google zintegrował Gemini z Bardem, swoim popularnym chatbotem, który teraz jest napędzany dostrojoną wersją Gemini 1.0 Pro. Zaktualizowany Bard, początkowo dostępny w języku angielskim w 170 krajach, jest gotowy do dalszej ekspansji. Dodatkowo, Gemini Nano wkrótce pojawi się w telefonach Google Pixel, zaczynając od Pixel 8 Pro, i zintegruje się z aplikacjami takimi jak Whatsapp.

W nadchodzących miesiącach Gemini zostanie zintegrowane z innymi usługami Google, w tym Google Search, Google Ads, Chrome i Duet AI. Programiści zainteresowani Gemini Pro będą mogli uzyskać do niego dostęp przez Google AI Studio lub Google Cloud Vertex AI, podczas gdy Gemini Ultra będzie dostępne dla wybranych klientów do wczesnych eksperymentów, z planami na szerszy dostęp dla deweloperów i klientów korporacyjnych w przyszłym roku.