“Google” prikazao robote čiji AI omogućava da sortiraju otpad za reciklažu
Kompanija “Google” je predstavila svoje dvogodišnje testiranje robota vođenih veštačkom inteligencijom (AI) koji sa visokim stepenom efikasnosti sortiraju reciklažni materijal i otpad, verovatno najavljujući doba koje tek dolazi.
Jedna studija je pokazala da sistemi učenja s utvrđivanjem (reinforcement learning – RL) mogu robotima da omoguće da sortiraju otpad u interakciji sa svojim okruženjem, primaju povratne informacije putem sistema nagradi i kazni, i optimizuju svoju aktivnost kako bi ukupno maksimizovali nagrade. To omogućava veštačkoj inteligenciji da liči na prirodnu inteligenciju najviše što je moguće.
Primenom RL-a, mobilni roboti sa sistemima za posmatranje i rukom bili su u stanju da se bave zadacima iz stvarnog sveta na radnom mestu, uz kombinaciju oflajn i onlajn podataka koji im omogućavaju da se prilagode širokoj varijabilnosti situacija u stvarnom svetu.
Studija je programirala robote koje je obezbedio Everyday Robots, deo “Google” matične kompanije Alphabet, da lutaju i traže „situacije otpada“ – kante za reciklažni materijal, kompost i smeće. Zatim su dobili zadatak da sortiraju predmete po kantama tako da se svi reciklažni materijali (limenke, flaše) stave u kantu za reciklažu, predmeti za kompostiranje (kartonske posude, papirne čaše) u kantu za kompost, a sve ostalo u kantu za ostatak otpada.
Roboti su dobili osnovni set veština – u procesu tokom koga se u računar učitava program koristeći mnogo manji početni program. Te veštine su uključivale četiri seta iskustava:
1) Skup jednostavnih ručno dizajniranih pravila koja imaju veoma nisku stopu uspeha, ali služe da obezbede neko početno iskustvo;
2) Simulirani okvir za trening koji koristi transfer simulirane realnosti da obezbedi neke početne strategije sortiranja kante;
3) „Robotske učionice“ gde roboti kontinuirano vežbaju na skupu reprezentativnih stanica za otpad;
4) I najzad stvarno okruženje i otpad, gde roboti vežbaju u pravim poslovnim zgradama sa pravim smećem.
Obrazlažući svoju motivaciju za ovo istraživanje, tim naučnika je naveo da se, pošto je stvarni svet kompleksan, raznovrsan i menja se tokom vremena, roboti sa RL-om muče da se adaptiraju pa se stoga još uvek ne koriste u svakodnevnom okruženju.
„Robotske učionice“ obezbeđuju jedan veliki deo iskustva za robote. Naučni tim je rekao da iako prave poslovne zgrade pružaju najreprezentativnije iskustvo, izdašnost u smislu prikupljanja podataka je ograničena — nekih dana će biti mnogo smeća za sortiranje, a nekih dana ne toliko.
Na kraju te dve godine, tim je sabrao 540.000 proba u učionicama i 32.500 proba na terenu. Otkriveno je da se ukupni učinak sistema poboljšavao kako je sve više podataka prikupljano. Konačno je finalni sistem procenjivan u učionicama kako bi se kontrolisalo poređenje sa scenarijima u zavisnosti od onoga što su roboti videli na terenu.
Osim 84% efikasnosti finalnog sistema, realni testovi pokazali su da sistem može da umanji kontaminaciju težinski za od 40 do 50 procenata. To je određeno na osnovu statistike iz tri testa u realnom svetu između 2021. i 2022. godine.
Tim je primetio da konačne RL instrukcije nisu bile uspešne svaki put, a biće potrebni i veći i snažniji modeli kako bi se poboljšala efikasnost i mogućnost da se primene na širi dijapazon zadataka. Drugi izvori iskustva, iz drugih zadataka, od drugih robota, pa čak iz onlajn videa, mogli bi da posluže da se dodatno obogati set veština i iskustava.