ChatGPT između korisnoga pomagala i nepouzdanoga nadomjestka

A Predstavljanje dobarNedavno predstavljanje konverzacijskoga modela umjetne inteligencije ChatGPT popraćeno je brojnim medijskim kontroverzijama te iznimno raznolikim ocjenama njegove učinkovitosti. Razumljivo, prigoda otvara i pitanje može li se ChatGPT model rabiti kao pomagalo u leksikografskom poslu, odnosno, manje optimistično, ne će li sve raširenijom primjenom takvih modela umjetne inteligencije djelatnost »leksikografa od krvi i mesa« postati na neki način suvišnom, ili barem manje vidljivom.

U ponedjeljak 13. ožujka stoga je u Velikoj dvorani Leksikografskoga zavoda održano interno predstavljanje nekih mogućnosti (i ograničenja) ChatGPT modela (besplatno dostupna inačica), napose s obzirom na hrvatsko jezično područje. Uvodna izlaganja održali su predsjednica Znanstvenoga vijeća dr. sc. Tea Rogić Musa i ravnatelj dr. sc. Filip Hameršak.

U tim izlaganjima te u raspravi što je uslijedila iznesena su razna opažanja i razmišljanja, od kojih dio prenosimo. Prije svega, ChatGPT model nesumnjivo može proizvesti uglavnom korektno sastavljene rečenice pa i dulje cjeline (i) na hrvatskom jeziku. S iznimkom veće brzine, iz znatnoga dijela odgovora ne može se na prvi pogled zaključiti da ih nije proizvelo ljudsko biće. U skladu s time, s ChatGPT modelom može se voditi i umnogome uvjerljiv pisani razgovor, pri čem će prethodno postavljena pitanja odnosno dani odgovori biti »zapamćeni« te u stanovitoj mjeri uzeti u obzir pri sastavljanju kasnijih odgovora. Imajući na umu kako sam ChatGPT iskazuje da je korpus tekstova iz kojih crpi svoje odgovore »zaključan« sa stanjem 2021. godine, jasno je da će odgovori o novijim zbivanjima sadržavati odgovarajuću ogradu.

Kako bilo, u pogledu sadržaja, postave li se razmjerno općenita, jednostavna pitanja iz, primjerice, hrvatske povijesti i kulture, uz mogućnost zadavanja opsega, dobit će se i razmjerno smisleni odgovori. Sličan je ishod i ako se, primjerice, zatraži nespecificirani tekst o hrvatskoj povijesti u tisuću riječi. Međutim, postoje li u zahvaćenom korpusu suprotstavljena mišljenja, poput onoga jesu li hrvatski i srpski jedan ili dva jezika, odgovor će, doduše, registrirati da postoje prijepori, ali ne će se ispravno razlučiti ni različita polazišta niti potkrjepe za ta, pa će odgovor u cjelini biti nesuvisao ili čak unutar sebe izravno proturječan. Slično tomu, zatraži li se, primjerice, tekst od tisuću riječi o hrvatskoj povijesti za Prvoga svjetskog rata, uz nešto točnih rečenica dobit će se i previše veoma općenitih, a podosta i potpuno netočnih tvrdnja, to jest takvih koje ne zastupa ni jedan pripadnik struke.

Razumljivo, kakvoća odgovora koje daje ChatGPT uvjetovana je, među ostalim, i sadržajem dostupnoga mu korpusa, koji će, predvidljivo je, rasti. S obzirom na to, trenutačno zacijelo najupadljiviji nedostatak nije nesavršeno kompiliranje odgovora iz po naravi stvari ograničenoga korpusa, već potpuno »izmišljanje« odgovora kad za njih u korpusu nema dovoljno temelja. Primjerice, na zahtjev da navede nekoliko generala hrvatskoga podrijetla u austrougarskim oružanim snagama 1914–1918. ChatGPT u odgovoru je naveo i Josipa Jelačića, tobože zaslužnoga za veliku pobjedu u Galiciji 1914. Također, upitan za knjige objavljenih hrvatskih sjećanja na Prvi svjetski rat, sastavio je fantazijsku listu stvarnih pisaca od kojih su neki umrli još prije izbijanja rata, povezanu bilo s njihovim, bilo tuđim, bilo izmišljenim djelima, od kojih u pravilu nijedno nema veze s ratom, kao i generički konstruiran, neutemeljen prikaz njihova sadržaja. Slično tomu, upitan da sastavi životopise više ključnih osoba iz hrvatske prošlosti dao je u više navrata mješavinu stvarnih i sasvim nemogućih navoda, a za neke internetski razmjerno dobro pokrivene povijesne osobe čak i cjelovito fiktivne životopise.

Na taj način, iako stručnjaku za dotičnu temu, možda, neki od takvih »kreativnih« odgovora može slučajno katkad biti i poticajan u smislu otkrivanja neke nove perspektive, običnom korisniku, nestručnjaku u mnogim će slučajevima biti nemoguće odvojiti »žito« od »kukolja«.

Udio potpuno promašenih odgovora zacijelo će se u budućnosti smanjivati (u međuvremenu ponuđena je i dodatno poboljšana inačica), ali teško je predvidjeti do koje razine, kao i na koji će se način nadilaziti razlike u podatcima i pristupima.

Teškoća je i u tomu što ChatGPT daje pogrješne odgovore o vlastitim mogućnostima. Primjerice, izravno upitan jesu li u njegovu korpusu i znanstveni radovi uvršteni u bazu Hrčak, dao je isprva potvrdan odgovor, ali na daljnja pitanja što bi podrazumijevala prolaženje kroz njihov tekst ili barem bibliografske opise kazao je da nema pristup. Slično tomu, nakon što je »ispravljen« u nekim navodima o izdanjima Leksikografskoga zavoda, upitan o tomu hoće li se točnim podatcima moći poslužiti i prema ostalim korisnicima, odgovorio je potvrdno, ali odgovarajuća promjena dosad nije zamijećena.

Ukratko, barem u području humanističkih i društvenih struka, i ne računajući ovom prigodom nerazmatrano strojno prevođenje, trenutačni dosezi ChatGPT po svem sudeći leksikografima nisu od bitnije koristi. Nasuprot tomu, na razini osnovne i srednje škole, a možda i pokojega fakultetskoga seminara, već sad zamisliti je generiranje tekstova za koje nastavnici ne bi mogli lako prepoznati da ih nije napisao nastavnik odnosno student.

Utoliko, prevladalo je mišljenje, »leksikografi od krvi i mesa« još dugo vremena ne će postati suvišni, barem ne u objektivnom smislu. S druge strane, upozoreno je, mogao bi se povećati broj korisnika ChatGPT koji, kao i u nekim drugim slučajevima, ne će shvaćati da sve dorađenija kakvoća odgovora ChatGPT počiva i na uvrštenju u njegov polazni korpus upravo tekstova koje su prethodno napisali živi leksikografi. Na tomu tragu, analogno nekim drugim, već viđenim situacijama, s vremenom bi se mogao bitno povećati i broj korisnika kojima će prva dobivena informacija ostati posljednja, a ne tek putokaz za produbljeniji uvid u stanje struke.

U krajnjoj crti, čula su se i takva predviđanja, mogli bi se u sve većoj mjeri pojaviti naraštaji koji ne će biti sposobni koliko-toliko samostalno sastaviti ni kraći ni dulji pisani tekst, štoviše svojevrsna regresija u neko novo, lošije doba pretežne usmenosti, lakonskih pisanih poruka i jednostavnih digitalnih sličica. Ne čudi stoga što je bilo govora i o zakonskoj zabrani ili barem ograničenju uporabe sličnih modela umjetne inteligencije (primjerice, odgovarajućim formalnim stupnjem digitalne pismenosti), na tragu sličnoga odnosa spram kloniranju i promjeni ljudskog genoma.

Kako bilo, nesumnjivo je riječ o jednom od epohalnih iskoraka koji će, u ovoj ili nekoj od poboljšanih inačica, na bolje ili na lošije, izmijeniti mnoga područja ljudske djelatnosti.

Napomena: ChatGPT počesto ne daje iste odgovore na ista pitanja. Također, premda se razgovori memoriraju, ne može im se uvijek pristupiti. Ilustrativni odgovori reproducirani u nastavku stoga se ponegdje razlikuju od odgovora danih na prezentaciji 13. ožujka.

Pin It

Naše web stranice koriste kolačiće kako bi Vam omogućili najbolje korisničko iskustvo, za analizu prometa i korištenje društvenih mreža.

Doznaj više