Članak ”The Problem of Industry 4.0: Data! – Part 2”, autora Christoph Roser-a, preveden je sa portala AllAboutLean.
U prošlom postu sam se osvrnuo na poteškoće koje se javljaju pri rukovanju podacima u Industriji 4.0. Posebnu pažnju sam posvetio kompleksnosti i često zanemarenom problemu spajanja podataka iz različitih izvora ili mašina. Ovo je drugi i finalni dio koji će zaokružiti ovu temu, te će obuhvatati još jedan bitan i zanemaren zadatak koji se zove čišćenje podataka.
Čišćenje podataka
Nakon što skupite sve podatke iz različitih izvora, potrebno je izvršiti čišćenje podataka. Npr. ako se prikupljaju podaci o zaustavljanju mašine, jedna mašina može definisati “stop” kao stanje kada je ugašena, dok druga može definisati “stop” kao vrijeme tokom kojeg se ništa ne proizvodi, a treća ga može shvatati kao vrijeme čekanja na dolazak dijelova. Ako se podaci sakupljaju sa različitih izvora, različite definicije mogu poboljšati ili unazaditi analizu. Obično je potrebno mnogo vremena da se takve stvari uoče i očiste. Imam osjećaj da ljudi koji se ne bave podacima misle da je analiza samo kopiranje podataka u Excel tabelu, ali moje iskustvo govori da čišćenje podataka uzima mnogo, MNOGO više vremena nego analiza.
Možda sam opitmista, ali vjerujem da svi podaci imaju značenje. Nažalost, značenje nije uvijek jasno ili potrebno. Ukoliko imate podatke, to ne znači da imate korisne podatke. Često se mora uraditi mnogo posla da se nasumični set podataka pretvori u koherentni set podataka.
A ovo čak ne uključuje mogućnost neispravnih podataka. Ovo potiče još od vremena prije računara. Npr. Charles Babbage (matematičar, filozof, izumitelj i inženjer mašinstva, 1791-1871) rekao je, Dva puta sam bio pitan “Gospodine Babbage, ako u mašinu stavite pogrešne brojke, hoće li se dobiti pravi odgovor? … Nisam u stanju ispravno shvatiti vrstu zbunjenosti koja je mogla izazvati takvo pitanje. Ovo vrijedi i danas: Smeće unutra, smeće vani!
Možda ste radili sa ERP softverom koji ima mnogo podataka. Ali često je analiza manjkava jer su podaci pogrešni. Jedan stažista u mojoj prethodnoj kompaniji je trebao analizirati prostor potreban za skladištenje. Izvukao je veličinu za različite dijelove ERP sistema i analizirao ih… potpuno zanemarujući da su podaci bili smeće. O-prstenovi su bili skladišteni na palete, blokovi motora u male kutije i podaci su bili u neredu. Morao je ručno proći kroz sve podatke da bi ih očistio.
Samo da se zna, dobri podaci nisu jeftini. Kažu da automobilske kompanije plaćaju oko €50 000 samo kako bi održavali podatke za jedan dio tokom njegovog životnog vijeka (ne na razvoj ili proizvodnju, samo na održavanje podataka). Obzirom na kompleksnost njihovih proizvoda, automobilske kompanije su obično bolje u ovome, ali čak i proizvođači veš mašina i bicikala plaćaju oko €8000 po jednom dijelu kako bi bili upotrebljivi. Teško je procijeniti koliko košta održavanje podataka Industrije 4.0 za postrojenja, ali vjerujem da je cijena “da ti oči ispadnu”. Ponavljam, u ovo ne ulazi cijena instaliranja senzora, hardware-y ili licenci za software-e, nego samo za održavanje podataka donekle čistim. A ova cijena obično nije na radaru većine promotera Industrije 4.0.
Kontinuirano obavljanje svega toga
Analizu je moguće izvršiti tek nakon što se izvršilo spajanje i čišćenje podataka (sedmicama poslije). Međutim, moć Industrije 4.0 nije u analiziranju podataka pola godine kasnije; moć je u analizi podataka u realnom vremenu ili u najgorem slučaju, veoma brzo. Postoje dvije opcije. Moguće je spojiti i očistiti podatke kad god budu potrebni za analizu. Ili je moguće napraviti sistem takvim da kontinuirano čisti i spaja podatke automatski. Lakše je to raditi samo kad je potrebno, ali onda se mora raditi iznova svaki put. Teže je ako se radi kontinualno, obzirom da je potrebno isprogramirati i pripremiti prikupljanje i procesiranje podataka; ali nakon što su očišćeni, ne moraju se čistiti ponovo i nadajmo se da su tokovi podataka upotrebljivi (bar dok se ne doda nova mašina ili promijeni senzor). Baš kao što je i slučaj sa čišćenjem kuće, lahko je to uraditi samo jednom, ali raditi to stalno je mnogo teže…
Razumijevanje podataka
Napokon, možete početi analizirati i razumjeti podatke. Ovaj dio može biti bilo šta, od kreiranja Excel tabele i ručne analize, analize varijanse (ANOVA) do umjetne inteligencije. Ovdje se ljudi koji rade u Industriji 4.0 opet uzbude, ali bez spajanja i čišćenja, ništa od ovoga ne bi bilo moguće. Naravno, algoritam će kao rezultat dati broj, i ako menadžment želi broj može ga dobiti. Ali… da li je on tačan ili će nas odvesti na pogrešan trag? Opet, smeće unutra, smeće vani! Ako želite donositi odluke na osnovu podataka, vaši podaci moraju biti dobri! Da li vi upravljate podacima, ili oni upravljaju vama? Naravno, posebno je teško u lean-u dobiti dobre podatke, iako su tu. Osim toga, mnogo podataka ne bude nikad iskorišteno. Imao sam jedan posao u održavanju, gdje su otkrili da koriste manje od 15% podataka koje imaju. Ovo je razumljivo, pogotovo ako se uzme u obzir da automobilska industrija proizvodi prek 20GB podataka po danu, sa trendom rasta.
Neki (teoretski) pokušaji rješavanja problema
Ovaj problem neurednih podataka nije nov. Npr. postoji Reference Architectural Model Industrie 4.0 (RAMI 4.0). Ovo je konstrukt koji pokušava da organizuje nekoliko različitih nivoa podataka vezanih za Industriju 4.0. To je top-down pristup koji opisuje kako rukovati podacima i kao mnogi pristupi u Industriji 4.0, nikad ne izgleda da će dostići kraj korisnosti. Nisam lično radio sa RAMI 4.0, ali ne ustručavam se. Ovaj problem je također vezan za I4.0 Maturity Index. Ove inicijative potiču iz Njemačke i pate od njemačke Industry 4.0 tendencije da obuhvataju teoretski konstrukt oko nečega ali da zanemare funkcionalnost.
Kako god, moj zaključak je da korištenje podataka iz različitih izvora stvara glavobolju. I opet, preporučujem da vaše Industry 4.0 pristupe ograničite i da opseg problema održite upravljivim. Ako pokušate sve popraviti, nećete ništa postići. Ako ne znate šta trebate popraviti, vjerovatno ćete završiti sa nečim što je korisno samo za letke za odnose s javnošću. Sada, idite i tražite upravljiv problem, uradite marljiv PDCA i organizujte svoju industriju!
- Veliko hvala Xie Xuan na savjetima ���