Institut des Systèmes Intelligents
et de Robotique

Partenariats

Sorbonne Universite

CNRS

INSERM

Tremplin CARNOT Interfaces

Labex SMART

Rechercher

A voir également

Short bio

AKLIL Nassim
Title : Doctorant.e
No longer in the unit

Sujet de thèse

Apprentissage actif sous contraite de budget en robotique et en neurosciences computationnelles: Localisation robotique et modélisation comportementale en environnement non stationnaire.

 

Résumé:

La prise de décision est un domaine vaste et très étudié en sciences, que ce soit en neurosciences pour comprendre les processus sous tendant la prise de décision chez les animaux, qu'en robotique pour modéliser des processus de prise de décision efficaces et rapides dans des tâches en environnement réel. Du point de vue des neurosciences, ce problème est résolu online avec des modèles de prises de décision séquentiels basés sur l'apprentissage par renforcement. Du point de vue de la robotique, l'objectif premier est l'efficacité, dans le but d'être déployés en environnement réel. Cependant, dans le cas de la robotique, ce que l'on peut appeler le budget et qui concerne les limitations inhérentes au matériel, comme par exemple les temps de calculs, les actions limitées disponibles au robot ou la durée de vie de la batterie du robot, ne sont, le plus souvent, pas prises en compte.
 
Nous nous proposons dans ce travail de thèse d'introduire la notion de budget comme contrainte explicite dans les processus d'apprentissage robotique appliqués à une tâche de localisation en mettant en place un modèle basé sur des travaux récents développés en apprentissage statistique qui traitent les données sous contrainte de budget, en limitant l'apport en données ou en posant une contrainte de temps plus explicite.
 
Dans le but d'envisager à plus long terme un fonctionnement online de ce type d'algorithmes d'apprentissage budgétisé, nous discutons aussi certaines inspirations possibles qui pourraient être prises du côté des neurosciences computationnelles. Dans ce cadre, l'alternance entre recherche d'information pour la localisation et la décision de se déplacer pour un robot peuvent être indirectement liés à la notion de compromis exploration-exploitation. Nous présentons notre contribution à la modélisation de ce compromis chez l'animal dans une tâche non stationnaire impliquant différents niveaux d'incertitude, et faisons le lien avec les méthodes de bandits manchot.

Parcours:

 
2013 - 2017: Doctorat en robotique sous la direction de Mehdi Khamassi, Benoît Girard et Ludovic Denoyer - UPMC - Paris, France.
 
2011 - 2013: Master d'informatique spécialité Bioinformatique et modélisation - Université Pierre et Marie Curie (UPMC - Paris6) - Paris, France.
 
2008 - 2011: Licence d'informatique générale - Université des Sciences et Technologies Houari Boumediene (USTHB) - Alger, Algérie.