Da bi je većina preduzeća uspješno koristila, umjetna inteligencija mora biti manje fokusirana na izgradnju modela i više na podatke, rekao je Andrew Ng u svom govoru na konferenciji Insight Partners ScaleUp: AI održanoj u New Yorku ranije ovog mjeseca. Do danas, razvoj AI je bio usredsređen na izgradnju modela, u kojima je razvijen algoritam koji će se što više uklapati u podatke. Za testiranje, istraživači bi preuzeli neki skup podataka s interneta. To je dovelo do mnogo široko korištenih neuronskih mreža opće namjene.
Ng-ov pristup usmjeren na podatke razlikuje se od ovog pristupa. Cilj mu je da se manji dio truda koncentriše na kod i veći naglasak na pokušaj “sistematskog rada na podacima”, rekao je Ng.
Ng smatra da će, u budućnosti, ovaj pristup pružiti “efikasniji način” izgradnje AI aplikacija.
Ng ima dugu biografiju kao pionirski AI. Ng je suosnivač i Coursera i DeepLearning.ai centara za online učenje. Njegov najnoviji poduhvat je Landing AI, koji pruža AI kao uslugu.
AI za sve
Do danas, veliki dio uticaja koji je AI imala u industriji koristio je velikim internet kompanijama za pretragu, preporuke, identifikaciju korisnika i slično. AI je vidio manje uspjeha u opštijim svakodnevnim poslovima, kao što je zdravstvena zaštita. Čak i među velikim kompanijama, samo mali procenat ima koristi od AI.
Način na koji velike internet kompanije razvijaju i primenjuju AI sisteme nije praktičan za većinu tradicionalnih preduzeća, tvrdi Ng.
Kao prvo, većina preduzeća ima znatno manje skupove podataka za rad. Tehnologija koja je izgrađena oko probavljanja 100 miliona ili više slika možda neće biti vrlo efikasna za broj slika koje dolaze iz nekog fabričkog procesa, a koji se može brojati samo u malim desetinama, na primjer.
Dobra vijest je da se iznenađujuće solidni AI sistemi mogu izgraditi oko manjeg skupa podataka, istakao je Ng. “Ne radi se o velikim podacima”, rekao je. Ni sistemi ne bi trebali biti ogromni. Internetske kompanije su navikle da utroše milione dolara u monolitni projekat, ali kompanija sa fabričkom linijom, na primer, možda će trebati desetine manjih AI sistema za inspekciju proizvoda u svakoj fazi.
Drugim riječima, ne možete izgraditi monolitnu platformu koja će zadovoljiti sve potrebe fabrike ili bolnice.Ng savjetuje usmjeravanje na visoko prilagođene vertikalne platforme za svaki slučaj upotrebe. Za ovo se ne bi pitali IT odjeli svake vertikale, već stručnjaci za predmet. Trik bi bio da se naprave alati kako bi omogućili stručnjacima da ne pišu kod, već da „projektuju podatke na način koji im omogućava da izraze znanje iz domena“, rekao je.
Šta je uključeno u inženjering podataka? Kao prvo, to uključuje čišćenje neurednih podataka. Ono što jedna osoba označi kao “čip”, druga osoba može označiti kao “ogrebotinu”. Jedna osoba može identificirati jednu ogrebotinu, a neko drugi to može označiti kao niz ogrebotina.
Ng je prenio priču o svom radu sa Dupontom, koji je pokušavao poboljšati svoj sistem kompjuterskog vida za inspekciju nedostataka na čeličnim limovima. U to vrijeme, bili su na 76% preciznosti, ali su željeli da to dovedu do 90%. Inženjeri su uzeli tradicionalni pristup rafiniranja modela uz mala poboljšanja. Ngov vlastiti tim je zauzeo suprotan pristup, gledajući nedosljednosti u kvalitetu podataka i šta ih je uzrokovalo. A ovaj pristup je zauzvrat doveo do modela sa mnogo većom preciznošću. Nakon što su stručnjaci za predmetnu temu jasno izrazili šta se sastoji od „defekta“, poboljšao je model.
Ideja koja stoji iza operacija usmjerenih na podatke je „izgraditi alate i prikazati dosljedno visokokvalitetne podatke iz svih faza AI projekta“, rekao je. „Jer ako možete pokazati da za sve ove faze imate pravi alat za dosljedno visoku kvalitetu podataka koji često rješavaju mnoge praktične probleme koji se pojavljuju.”
Captive AI
Kada je riječ o izvlačenju vrijednosti iz AI, pokazalo se da je “infrastruktura umjetne inteligencije mnogo važnija nego što bismo mislili kao izvor diferencijacije”, primijetio je Lonne Jaffe, izvršni direktor u investicijskoj kompaniji Insight Partners (koja posjeduje The New Stack) tokom drugog govora na konferenciji.
Trik je u tome da se ML učini veoma skalabilnim, rekao je. Ovo postaje dvostruko teško na rubu, gdje ML sistemi mogu zahtijevati i pretprocesiranje i sposobnost zaključivanja unutar potrošačkog uređaja, kao i koordinaciju sa backend centrom podataka. Većina današnjih sistema baza podataka nije izgrađena za ove federalne arhitekture.
Jedna kompanija iz portfelja Insight-a koja pravi uspjehe od skalabilnosti je Run:AI, koja nudi ono što je Jaffe uporedio sa „VMware za GPU-ove“. Ideja je ne samo da se usluga pojeftini već da se infrastrukturom upravlja na takav način da bude „kvalitativno drugačija i bolja“. Zbog svoje efikasnije infrastrukture, Hour One, koji je upravo najavio rundu finansiranja ove sedmice, omogućava vam da platite tek kada završite iteraciju do konačnog proizvoda.
Polje je toliko veliko da se račva na razne načine, napomenuo je. Analitika zasnovana na umjetnoj inteligenciji, na primjer, “ispada da se više razlikuje od tradicionalne analitičke hrpe podataka nego što smo prvobitno mislili”, rekao je, ukazujući na stručnjaka za praćenje AI eksperimenta i optimizaciju hiperparametara Weights & Biases, koji nemaju savršen analog u tradicionalnoj analitici.
Čak se i MLOps stack za strukturirane podatke razlikuje od onog za nestrukturirane podatke. Pristup koji koristi Overjet, a koji nudi prepoznavanje slike za zadatke kao što su stomatološki pregledi, veoma se razlikuje od onog koji koristi Zest AI, koji koristi strukturiranije podatke za donošenje odluka o pozajmljivanju.
Insight ulaže u softver oko 20 godina, a Jaffe je bio generalni direktor u kompaniji oko pet godina, izgrađujući portfelj koji uključuje kompanije za podršku AI infrastrukturi, kao i one koje koriste AI za pružanje određene usluge.
Za kompanije koje nude AI softver kao svoj proizvod, potreban talent se razlikuje od uobičajenog softverskog inženjera po tome što bi željeli da budu aktuelni u akademskoj zajednici uz uživanje u prednostima rada za komercijalnu organizaciju.
Uz AI infrastrukturu i AI kao proizvod, Jaffe vidi treću kategoriju u nastajanju, ali rastuću: Captive AI.
Sa Captive AI, posao ne može lako koristiti AI kao uslugu od dobavljača jer je AI srž strategije. „Kompanije su sistemi učenja, ljudi su sistemi učenja. I tako, ako je osnovni sistem učenja u organizaciji sada pokretan AI, ili će postojeći zaposleni pokušati ‘uraditi sami’, ili ako ne mogu zaposliti pravi talenat ili napraviti prava ulaganja, klasa novih, ometajućih ScaleUps bi se mogli pojaviti, a mi to počinjemo viđati sve više i više,” rekao je Jaffe.
Jedan primjer je Netflix, koji je prešao na originalni program, oblikovan prema preferencijama svoje korisničke baze. Takođe, jedna od investicionih kompanija Insight-a, Prose, formuliše personalizovane šampone za kupce na osnovu personalizovane analize veštačke inteligencije bezbroj faktora — tipa i teksture kose, životnih navika, izloženosti okolini, pa čak i ishrane i nivoa stresa. Takve preporuke bilo bi nemoguće provesti, barem na proizvodnoj osnovi, bez AI.
Sa Captive AI, “oblik firme, ili sama industrija može se promijeniti”, rekao je.
Članak „AI Development Needs to Focus More on Data, Less on Models“ autora Joab Jackson-a preveden je sa portala The New Stack.