Početkom 2023. godine spomen umjetne inteligencije postao je svakodnevnica. Članci na portalima, objave na društvenim mrežama, profilne slike generirane umjetnom inteligencijom samo su neki od mnoštva primjera zasićenosti medija, tradicionalnih i digitalnih, konceptom i proizvodima umjetne inteligencije.
Članak nastao u saradnji s platformom HulkApps
. . .
Prosječnom čovjeku, koji nema dodir s tehnologijom koja se nalazi u pozadini „AI revolucije“ ona se vjerovatno čini veoma iznenadnom. Istina je, međutim, da se ona sprema već više od pola stoljeća.
Umjetna inteligencija, kao pojam, prvi put je spomenuta u pisanom prijedlogu za istraživanje koje je predao John McCarthy augusta 1955. godine na Dartmouth College-u. Međutim, čak ni to nije prva stvarna pojava umjetne inteligencije u naučnom kontekstu – ta čast pripala je članku „A Logical Calculus of the Ideas Immanent in Nervous Activity“ autora Warren S. McCulloch i Walter Pitts, objavljenog u časopisu „Bulletin of Mathematical Biophysics“, koji opisuje obavljanje jednostavnih logičkih funkcija kod pojednostavljenih umjetnih „neurona“. Na tom članku temelje se današnje kompjuterske „neuralne mreže“, kojima je glavna funkcija emulacija ljudskog mozga.
Još davne 1950. godine nastaje prva implementacija umjetne inteligencije, objavom članka „Programming a Computer for Playing Chess“ u kom je opisano kako isprogramirati kompjuterski program koji igra šah protiv ljudskog protivnika. Ovakve programe teško da je moguće usporediti s današnjim implementacijama umjetne inteligencije, ali im ne možemo osporiti historijski značaj. Zahvaljujući njima, pokrenuto je dugogodišnje šahovsko nadmetanje između čovjeka i mašine, koje je kulminiralo mečevima između DeepBlue programa za igranje šaha i tadašnjeg svjetskog prvaka u šahu, Garryja Kasparova. Taj trenutak je označio prekretnicu u razvoju umjetne inteligencije.
Uzimajući ove informacije u obzir, logično je postaviti pitanje zašto umjetna inteligencija nije ranije postala dio popularne kulture. Odgovor je trojak:
Mikročipovi jednostavno nisu bili dovoljno jaki. Broj tranzistora u mikročipu je jedan od osnovnih načina mjerenja njegove komputacijske moći, a broj tranzistora u najjačim mikročipovima dostupnim u doba začetka umjetne inteligencije kretao se do 1000. Moore-ov zakon, koji nalaže da se broj tranzistora u mikročipovima duplira svake dvije godine, kroz historijat digitalnih kompjutera se pokazao istinitim. Zahvaljujući ovom nevjerovatnom eksponencijalnom rastu, u zadnjih nekoliko godina, kompjuteri su napokon dostigli komputacijsku moć potrebnu za nivo umjetne inteligencije koji zamišljamo već desetljećima.
Količina dostupnih podataka nije bila dovoljna. Mašine ne uče kao ljudi. Djetetu se može pokazati slika mačke i reći „ovo je mačka“ i dijete će znati razaznati mačku od drugih životinja. Međutim, mašini se ne može samo pokazati slika mačke, niti objasniti razlika između mačke i ostalih životinja kako bi ona znala razaznati mačku od drugih životinja.
Mašini se mora dati jako veliki broj slika mačaka i tačno naglasiti na kojem dijelu slike se nalazi mačka, kako bi, kroz razne algoritme, ona mogla napraviti pretpostavke oko toga šta se može smatrati mačkom. Konkretan primjer tog učenja su „captcha provjere robota“. Ako ste ikada, pri ulasku na neku web stranicu, morali da kliknete na sve kvadrate koji sadržavaju specifičan objekat, kao što su pješački prelaz, semafor, bicikl, ili nešto slično, direktno ste učestvovali u kreiranju seta podataka za podučavanje samovozećih auta, kakve proizvodi npr. Tesla. Većina ljudi koja svakodnevno koristi internet, bar jednom dnevno je prinuđena da uradi ovakav zadatak kako bi mogla pristupiti nekoj web stranici. Zahvaljujući milionima korisnika interneta koji rade milione ovakvih provjera dnevno, napravljen je enormno veliki set podataka koji čine različite slike i ljudske interpretacije objekata koji se na njima nalaze. Ovakvi setovi podataka se kasnije obrađuju algoritmima mašinskog učenja koji „proučavaju“ svaku kombinaciju slike i ljudske interpretacije objekata na njoj. „Proučavanjem“ dovoljno velikog seta takvih kombinacija, mašina uči kako da sama razazna objekte na slikama koje do tada nije vidjela. Tako mašina uči: ne uviđanjem, nego repeticijom koja je omogućena silnom količinom podataka koja je danas dostupna.
Umjetna inteligencija se već neko vrijeme implementira, ali iza kulisa. Dosadašnja implementacija umjetne inteligencije nije bila transparentna krajnjim korisnicima. Kada čujemo izraz umjetna inteligencija, mašta nam uvijek odluta na robote čija inteligencija parira ili čak prevazilazi ljudsku; zamišljamo robote s kojima imamo pune konverzacije i koji nam daju odgovore na sva pitanja koja im postavimo. Pojam umjetna inteligencija ne podrazumijeva nužno direktnu emulaciju ljudske inteligencije, podrazumijeva mnogo više od toga.
Jedan od izraza koje često čujemo kada govorimo o umjetnoj inteligenciji, jeste mašinsko učenje. Mašinsko učenje omogućava algoritmima da uče iz podataka, obično s ciljem pravljenja predikcija ili odluka bez eksplicitnog programiranja za takvo ponašanje. Vjerovali ili ne, s umjetnom inteligencijom baziranom na mašinskom učenju susrećemo se svakodnevno veći dio desetljeća. Susrećemo je kada pretražujemo Google, gdje su rezultati pretrage bazirani na algoritmu mašinskog učenja koji nam servira rezultate na osnovu naše lokacije, godina, spola, dosadašnjih pretraga i drugih faktora.
Susrećemo je na društvenim mrežama, gdje je redoslijed objava na našim početnim stranicama baziran na algoritmu koji nam servira objave na osnovu naših dosadašnjih interakcija s objavama, profilima, lokaciji i godinama. Svaka reklama koju vidimo na bilo kojoj web stranici, servirana nam je od strane algoritma mašinskog učenja na osnovu nevjerovatno kompleksnog skupa faktora. Iako je umjetna inteligencija sveprisutna na internetu već neko vrijeme, korporacije nikada nisu reklamirale njenu implementaciju.
Činjenica jeste da mnogo podataka „poklanjamo“ raznim kompanijama, kroz našu historiju pretrage, GPS lokaciju, online profile u našoj blizini i slično, te da ih kompanije koriste za treniranje algoritama za mašinsko učenje. Ipak treba postaviti pitanje u kojoj mjeri i kada to postaje invazivno i nepotrebno.
Sigurno vam se desilo da razgovarate s nekim o određenoj temi, pa da vam netom nakon toga na nekoj društvenoj mreži bude servirana reklama za tačno to o čemu ste razgovarali. Vjerovatno ste pomislili da kompanije prisluškuju vaše razgovore kroz telefone i koliko je to jezivo. Međutim, kompanije nas zapravo ne prisluškuju preko telefona. Istina je možda čak i jezivija: algoritmi mašinskog učenja veoma uspješno predviđaju stvari o kojima ćemo razgovarati. Razmislite o tome na trenutak. Kompanije koje serviraju reklame imaju toliko sveobuhvatan profil o vama, vašim navikama i interesovanjima, a algoritam toliko dobro razvijen da na osnovu vašeg profila i profila osoba u vašoj blizini, može predvidjeti o čemu ćete razgovarati.
Naravno, na sve to sami pristajemo u vidu „terms and conditions“ i „privacy policy“ boksova koje čekiramo bez čitanja kako bismo mogli napraviti nalog na svakoj od aplikacija koje koristimo. Unutar tih beskrajno dugih dokumenata nalaze se tačke koje jasno opisuju tipove i količinu ličnih podataka koje će ta aplikacija skupljati, kao i treća lica kojima će ih prodavati. Ti podaci su sirovi materijal koji se kroz algoritme mašinskog učenja prerađuje u korisne informacije koje se mogu kasnije iskoristiti u neku prethodno navedenu svrhu, ili u neku od mnogih koje nisu navedene. Trgovina podacima (u cilju treniranja algoritama mašinskog učenja) je veoma brzo postala jedan od najunosnijih tipova biznisa na svijetu, a po svemu sudeći taj trend će se nastaviti i u budućnosti. Xiaomi, telefonski brend koji je treći u svijetu po udjelu na tržištu, sa čak 12 posto udjela na globalnom tržištu mobilnih uređaja, sebe veoma često ne naziva proizvođačem mobilnih uređaja, već „internet kompanijom koja prodaje hardver“. Xiaomi nije izdvojen zato što je kineska firma, niti zato što Xiaomi specifično zloupotrebljava naše podatke, već zato što je jedini od velikih proizvođača koji otvoreno i transparentno skuplja, koristi i prodaje naše podatke u cilju poboljšanja algoritama mašinskog učenja. Umjetna inteligencija u službi tehnoloških korporacija je odavno stavila cijenu na naše podatke.
Da li je moguće živjeti i funkcionirati u modernom svijetu bez telefona nekog od velikih proizvođača? Kada smo zadnji put vodili konverzaciju, glasovnu ili tekstualnu, dužu od par rečenica na nečemu osim na nekolicini velikih aplikacija za tekstualnu i glasovnu komunikaciju? Kada smo tražili neki novootvoreni restoran, a da to nije bilo na najvećoj navigacijskoj aplikaciji?
Naravno da se sve navedeno može zaobići – moguće je kupiti telefon proizveden od strane proizvođača kome je privatnost veći prioritet; moguće je koristiti alternativne aplikacije sa boljom enkripcijom kako bi naši razgovori bili privatniji; moguće je koristiti navigacijske aplikacije koja ne šalju našu trenutnu lokaciju na server, već je čuvaju lokalno na uređaju. Te opcije postoje, ali kada znamo da 67 posto globalnog tržišta telefona u Q2 2023 čini 5 korporacija, da 72 posto američkog tržišta navigacijskih aplikacija 2019. godine čini jedna korporacija, da 89 posto globalnog tržišta aplikacija za slanje instantnih poruka u Q2 2019 čine samo dvije aplikacije koje se nalaze pod krovom iste korporacije ili da se 91 posto svih pretraga na internetu izvrši kroz jedan pretraživač, zaključak je da to i nije baš realistično. Naravno da je moguće pronaći alternativu, ali uz značajnu količinu uloženog vremena i truda, uz analiziranje svakog kupljenog uređaja, svake skinute aplikacije i svakog napravljenog naloga, uz odricanje velikog broja usluga koje današnji život čine onakvim kakav jeste. Moguće je, ali veoma teško.
S druge strane, sve prikupljanje podataka zajedno s mašinskim učenjem vodi ka neupitno boljem korisničkom iskustvu. Društveni mediji nam serviraju tipove objava koje algoritmi smatraju da su nam najinteresantnije.
Pretraga interneta nam daje rezultate za koje algoritmi smatraju da su najrelevantniji za nas s najvećom vjerovatnoćom da daju odgovor na naše pitanje. Navigacijske aplikacije nas vode u restoran u našoj blizini, iako možda na svijetu ima mnogo restorana s istim imenom. Ako želimo da kupimo nove cipele, servirat će nam se reklame za cipele koje algoritam smatra da bi nam se mogle svidjeti.
Alati poput ChatGPTija i Midjourneyja su došli u žižu javnosti kao prve komercijalno dostupne implementacije umjetne inteligencije koje se poklapaju s kolektivnom slikom toga šta umjetna inteligencija treba da predstavlja. Oni su pokazatelj toga šta enormne količine podataka, u kombinaciji sa algoritmima genijalnih kompjuterskih inženjera i naučnika mogu da postignu. Iako se čine kao potpuna naučna fantastika, polako, ali sigurno, pronalaze svoje mjesto u svijetu. Ipak, takvi alati su samo kap u okeanu AI alata koji se danas koriste.
Vraćamo se na početno pitanje: u kojoj mjeri i kada prikupljanje naših podataka postaje invazivno? Gdje povlačimo granicu? Da li velike strašne korporacije profitiraju na neinformiranim korisnicima, ili samo vrše jednostavnu razmjenu dobara – naši lični podaci u zamjenu za korištenje i kontinuirano poboljšavanje aplikacija?
Granicu, ipak, povlači svako od nas za samoga sebe. Na nama je odluka da li ćemo dati korporacijama do znanja da želimo svjesno donositi odluke da li i koje podatke dijelimo s njima. Invazivno je ukoliko mi, kao individue, odlučimo da je invazivno za nas. Stav „uzmi ili ostavi“ za online usluge jednostavno nije etičan ukoliko realistične alternative ne postoje, a korištenje tih usluga podrazumijeva se za život u modernom dobu. Moralna dužnost korporacija je da obznane koje podatke skupljaju i kako ih koriste i da dozvole isključenje pojedinačnih korisnika iz sistema podjele podataka, a naša je dužnost da pročitamo svaki digitalni ugovor koji potpisujemo kako bismo bili informirani gdje i kako se koriste naši podaci.