Toni Mancini

[login|nuovo account] [Italiano|English]

Avvisi
23/4/2024	25 aprile: l'Italia ricorda la liberazione dall'occupazione nazista e dal regime fascista, simboleggiata dall'insurrezione del 25 aprile 1945 proclamata dai Partigiani. [Ultime lettere di condannati a morte e di deportati della Resistenza italiana] [Costituzione della Repubblica].

Laurea in Informatica, Corso di

Intelligenza Artificiale

Edizione dell'a.a. 2022/2023

Codice insegnamento: 1022262
Numero CFU: 6

Tutor: Marco Esposito

Seminari tenuti dagli studenti

La prossima sessione di seminari tenuti dagli studenti del corso di Intelligenza Artificiale (come parte del loro esame) si terrà Martedì 26 settembre 2023 in aula Seminari, via Salaria 113, terzo piano.

Programma

15.30: Francesco Maria Longobardi:
Apprendimento per rinforzo e Q-learning: soluzione per la navigazione autonoma dei robot mobili.

Abstract: La crescente diffusione della robotica industriale ha rivoluzionato il settore manifatturiero, offrendo alle aziende l'opportunità di ridurre i costi e minimizzare i rischi attraverso l'impiego di robot autonomi per svolgere compiti specifici. Nella sfera dei robot mobili, la navigazione autonoma assume un ruolo cruciale per consentire a questi dispositivi di raggiungere destinazioni specifiche, evitare ostacoli e pianificare il percorso ottimale.

Questo studio si propone di affrontare il tema dell'addestramento di un robot mobile nel determinare il percorso più breve tra qualsiasi posizione all'interno di un magazzino, dove avviene il prelievo di merci, e la destinazione finale nell'area spedizioni, dove avviene il confezionamento e la spedizione dei pacchi. Durante questo processo, l’agente terrà conto delle restrizioni ambientali del magazzino e della disposizione degli scaffali, che rappresentano ostacoli.

Per raggiungere questo obiettivo, adotteremo una metodologia basata sull'apprendimento per rinforzo, che consente agli agenti autonomi di apprendere attraverso l'interazione diretta con l'ambiente circostante. In particolare, verrà esaminato l'algoritmo Q-learning.

Ciò che rende questo approccio interessante rispetto ad altri modelli è l'assenza della necessità di intervento da parte di un esperto umano (approccio supervisionato) e l'eliminazione del bisogno di dati di addestramento preesistenti. L'agente apprende autonomamente esplorando l'ambiente, sperimentando azioni e ricevendo feedback (ad esempio, ricompense) in un contesto dinamico. Questo processo iterativo permette all'agente di adattarsi ai cambiamenti dell'ambiente senza la necessità di una supervisione esplicita.

Il software sviluppato per implementare l'algoritmo Q-learning consente al robot di navigare in modo autonomo attraverso azioni di movimento all'interno del magazzino, rappresentato da una matrice in cui ciascuna cella definisce un aspetto dell'ambiente (percorso, ostacolo o area spedizioni), e da una matrice di ricompense, utilizzata per apprendere dinamicamente la politica di navigazione ottimale.

L'approccio basato su Q-learning si è dimostrato efficace nel raggiungere la navigazione autonoma. Questo metodo è adattabile, scalabile e non richiede un controllo umano costante. Tuttavia, l'efficacia del Q-learning è influenzata dalla qualità dei dati di addestramento, dalla rappresentazione degli stati e delle azioni, nonché dalla scelta dei parametri chiave come alpha, gamma ed epsilon. Inoltre, il processo di apprendimento potrebbe richiedere un periodo di addestramento ed esplorazione prolungato per raggiungere una politica ottimale.

In conclusione, questo studio evidenzia il ruolo fondamentale dell'apprendimento per rinforzo nell'ottimizzazione della navigazione autonoma dei robot mobili in ambienti complessi come i magazzini. Nonostante il suo notevole potenziale, il reinforcement learning deve ancora affrontare sfide legate alle risorse computazionali e alla convergenza durante l'addestramento. Il progressivo sviluppo e affinamento degli algoritmi di reinforcement learning, inclusa l'integrazione con il deep learning, offrono prospettive interessanti per migliorare ulteriormente l'efficienza e l'efficacia delle politiche di decisione dei sistemi autonomi.
16.00: Termine dei seminari.

Gli studenti sono cordialmente invitati a partecipare numerosi!

[This web site could never be realised without the sophisticated features of a pure text editor and the extreme power of 220V]