Negli ultimi anni, il campo d’azione della robotica non si limita più alla sola industria, ma si sta espandendo in sempre più aspetti della vita umana. Per operare con successo in questa grande varietà di contesti, la prossima generazione di robot dovrà diventare sempre più autonoma e pronta ad adattarsi a diversi scenari. In tale contesto, le tecniche di Machine Learning e Reinforcement Learning possono fornire degli strumenti importanti per affrontare le sfide che coinvolgono una diffusione su larga scala dei sistemi robotici. Questi metodi data-driven potranno, potenzialmente, dotare i robot dei mezzi per gestire l’incertezza che caratterizza gli ambienti non strutturati nei quali verranno impiegati. A tale riguardo, i Gaussian Process si sono affermati come una tecnica di Machine Learning molto potente e flessibile. Essi possono essere utilizzati per risolvere complessi problemi di regressione, fornendo direttamente una stima dell’incertezza associata alle previsioni. In questa tesi, presentiamo soluzioni basate su Gaussian Process per diversi problemi di modellazione e controllo. In particolare, abbiamo sviluppato un nuovo algoritmo Model-Based Reinforcement Learning, chiamato Monte Carlo Probabilistic Inference for Learning COntrol (MC-PILCO), che può imparare autonomamente come controllare un sistema. L’algoritmo è stato poi modificato in modo tale da essere capace di gestire la presenza di misure parziali dello stato, condizione comune quando si lavora su sistemi meccanici. La tesi prosegue presentando una strategia data-driven per il controllo di robot, che utilizza dei Gaussian Process per stimare la dinamica inversa, utilizzandola poi all’interno di uno schema di controllo basato su feedback linearization. Infine, concludiamo esplorando le possibilità offerte dai Gaussian Process per la modellizzazione di dinamiche ad alta dimensionalità. Dei Gaussian Process sono stati impiegati sia per imparare una mappa che proietta le osservazioni ad alta dimensione in uno spazio latente di dimensione ridotta, che per stimare una funzione di transizione appropriata all’interno di questo spazio latente. Abbiamo chiamato il modello complessivo Controlled Gaussian Process Latent Variable Model (CGPDM), e lo abbiamo utilizzato per modellare la dinamica di un pezzo di tessuto manipolato da un robot. In ciascuno dei problemi studiati, le nostre soluzioni sono state valutate empiricamente usando dati reali e simulati.
Gaussian Processes for Data-Driven Modeling and Control in Robotic Applications
Fabio Amadio
2021
Abstract
Negli ultimi anni, il campo d’azione della robotica non si limita più alla sola industria, ma si sta espandendo in sempre più aspetti della vita umana. Per operare con successo in questa grande varietà di contesti, la prossima generazione di robot dovrà diventare sempre più autonoma e pronta ad adattarsi a diversi scenari. In tale contesto, le tecniche di Machine Learning e Reinforcement Learning possono fornire degli strumenti importanti per affrontare le sfide che coinvolgono una diffusione su larga scala dei sistemi robotici. Questi metodi data-driven potranno, potenzialmente, dotare i robot dei mezzi per gestire l’incertezza che caratterizza gli ambienti non strutturati nei quali verranno impiegati. A tale riguardo, i Gaussian Process si sono affermati come una tecnica di Machine Learning molto potente e flessibile. Essi possono essere utilizzati per risolvere complessi problemi di regressione, fornendo direttamente una stima dell’incertezza associata alle previsioni. In questa tesi, presentiamo soluzioni basate su Gaussian Process per diversi problemi di modellazione e controllo. In particolare, abbiamo sviluppato un nuovo algoritmo Model-Based Reinforcement Learning, chiamato Monte Carlo Probabilistic Inference for Learning COntrol (MC-PILCO), che può imparare autonomamente come controllare un sistema. L’algoritmo è stato poi modificato in modo tale da essere capace di gestire la presenza di misure parziali dello stato, condizione comune quando si lavora su sistemi meccanici. La tesi prosegue presentando una strategia data-driven per il controllo di robot, che utilizza dei Gaussian Process per stimare la dinamica inversa, utilizzandola poi all’interno di uno schema di controllo basato su feedback linearization. Infine, concludiamo esplorando le possibilità offerte dai Gaussian Process per la modellizzazione di dinamiche ad alta dimensionalità. Dei Gaussian Process sono stati impiegati sia per imparare una mappa che proietta le osservazioni ad alta dimensione in uno spazio latente di dimensione ridotta, che per stimare una funzione di transizione appropriata all’interno di questo spazio latente. Abbiamo chiamato il modello complessivo Controlled Gaussian Process Latent Variable Model (CGPDM), e lo abbiamo utilizzato per modellare la dinamica di un pezzo di tessuto manipolato da un robot. In ciascuno dei problemi studiati, le nostre soluzioni sono state valutate empiricamente usando dati reali e simulati.File | Dimensione | Formato | |
---|---|---|---|
tesi_definitiva_Fabio_Amadio.pdf
Accesso riservato
Tipologia:
Tesi di dottorato
Licenza:
Accesso privato - non pubblico
Dimensione
32.59 MB
Formato
Adobe PDF
|
32.59 MB | Adobe PDF | Visualizza/Apri Richiedi una copia |
Pubblicazioni consigliate
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.