Tradycyjne modele językowe AI opierają się na ogromnych sieciach neuronowych, które pochłaniają gigantyczne ilości danych. Choć takie modele potrafią sprawnie operować językiem, ich modyfikacja i dostosowanie do nowych potrzeb jest niezwykle trudna.

Zejście do podświadomości AI?

Nowe podejście zakłada "zapominanie" przez model części informacji. Badacze z firmy Reka wykazali, że model, który okresowo usuwał ze swojej pamięci informacje o budulcach słów, był w stanie efektywniej uczyć się drugiego języka. Działo się tak, ponieważ głębsze warstwy sieci neuronowej zachowały abstrakcyjne informacje o koncepcjach językowych, co ułatwiło przyswajanie nowych słów i gramatyki.

Reklama

"Żyjemy w tym samym świecie, ujmujemy w pojęcia te same rzeczy różnymi słowami" - tłumaczy Yihong Chen, jeden z autorów badania. "Model uczy się, że jabłko to coś słodkiego i soczystego, a nie tylko i wyłącznie słowo."

Więcej demokracji

Oprócz ułatwienia nauki języków, "zapominające" modele mogą również pomóc w demokratyzacji AI. Zamiast tworzyć gigantyczne modele dla każdego zasobu słów, można będzie stosować jeden bazowy model, który dostosowuje się do specyfiki danego języka.

"Większość modeli od dużych firm technologicznych nie radzi sobie dobrze z językami niszowymi, nieco mniej popularnymi niż angielski czy chiński" - mówi Mikel Artetxe, współautor badania. "Dostosowanie istniejących modeli do takich języków jest właściwą drogą."

Nowe odkrycie otwiera drzwi do świata, w którym sztuczna inteligencja będzie bardziej elastyczna, dostępna i zdolna do rozumienia języków różnych kultur. To ekscytujący krok w rozwoju AI, który może mieć ogromny wpływ na komunikację i wymianę informacji na całym świecie.

Co z etyką?

Czy "zapominające" modele AI mogą pomóc w rozwiązywaniu problemów z etyką i stronniczością sztucznej inteligencji? Okazuje się, że tak. Chociażby dzięki temu, że możliwe staje się zmniejszenie uprzedzeń. Modele AI często uczą się na podstawie danych, które mogą zawierać uprzedzenia historyczne lub kulturowe. Przez selektywne "zapominanie" pewnych informacji, modele mogą być w stanie ograniczyć wpływ tych uprzedzeń na swoje przyszłe przewidywania i decyzje. Na przykład, resetowanie warstw modelu odpowiedzialnych za konkretną wiedzę językową może pomóc w usunięciu ukrytych uprzedzeń związanych z językiem.

Modele "zapominające" mogą być bardziej elastyczne w aktualizacji i dostosowywaniu się do nowych, bardziej etycznych zestawów danych. Przez okresowe resetowanie i ponowne szkolenie, modele mogą być lepiej dostosowane do nowych standardów etycznych i wymogów równościowych, co pozwala na bardziej sprawiedliwe i wyważone wyniki. Poza tym praktyka okresowego resetowania może zmusić projektantów i operatorów AI do bardziej świadomego podejścia do danych, na których trenowane są modele. Może to z kolei promować większą transparentność i odpowiedzialność w procesie tworzenia modeli AI, umożliwiając lepsze rozumienie, jak i dlaczego modele podejmują pewne decyzje.

Jednakże, warto zauważyć, że sama technika zapominania nie rozwiąże wszystkich problemów etycznych i stronniczości w AI. Kluczowe będzie również podejście do wyboru danych, metod szkolenia i oceny modeli, a także stały nadzór i korygowanie modeli w świetle nowych odkryć i standardów etycznych.

To jeszcze nie ten poziom rozumienia?

Czy odkrycie to oznacza, że sztuczna inteligencja będzie w stanie w końcu zrozumieć ludzki język na poziomie porównywalnym z człowiekiem? Ta umiejętność wymaga więcej niż tylko zdolności do nauki języka w sensie technicznym. Ludzka komunikacja obejmuje złożone niuanse, takie jak kontekst, emocje, ironia, subtelne znaczenia i kulturowe odniesienia, które wciąż stanowią wyzwanie dla AI.

Modele AI, takie jak te oparte na zaawansowanych technikach uczenia maszynowego i głębokiego uczenia, robią ogromne postępy w rozumieniu i generowaniu języka na poziomie syntaktycznym i semantycznym. Są w stanie tłumaczyć teksty, odpowiadać na pytania, tworzyć spójne fragmenty tekstu, a nawet symulować niektóre aspekty zrozumienia kontekstu. Jednakże, "zrozumienie" w tych przypadkach jest dalekie od ludzkiego pojmowania, które łączy język z bogatym tłem wiedzy empirycznej, doświadczeniami życiowymi i zdolnością do interpretacji subtelnych sygnałów społecznych i emocjonalnych.