Παρακολούθηση
Ronan Fruit
Ronan Fruit
PhD candidate, Inria Lille, SequeL team
Η διεύθυνση ηλεκτρονικού ταχυδρομείου έχει επαληθευτεί στον τομέα inria.fr - Αρχική σελίδα
Τίτλος
Παρατίθεται από
Παρατίθεται από
Έτος
Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning
R Fruit, M Pirotta, A Lazaric, R Ortner
Proceedings of the 35th International Conference on Machine Learning 80 …, 2018
1062018
Near optimal exploration-exploitation in non-communicating markov decision processes
R Fruit, M Pirotta, A Lazaric
Advances in Neural Information Processing Systems, 2994-3004, 2018
462018
Exploration--Exploitation in MDPs with Options
R Fruit, A Lazaric
Proceedings of the 20th International Conference on Artificial Intelligence …, 2017
462017
Regret Minimization in MDPs with Options without Prior Knowledge
R Fruit, M Pirotta, A Lazaric, E Brunskill
Advances in Neural Information Processing Systems, 3166-3176, 2017
282017
Exploration Bonus for Regret Minimization in Undiscounted Discrete and Continuous Markov Decision Processes
J Qian, R Fruit, M Pirotta, A Lazaric
arXiv preprint arXiv:1812.04363, 2018
112018
Regret Minimization in MDPs with Options
R Fruit, M Pirotta, A Lazaric, E Brunskill
Analysis of Learning and Planning with Options
R Fruit, A Lazaric
Δεν είναι δυνατή η εκτέλεση της ενέργειας από το σύστημα αυτή τη στιγμή. Προσπαθήστε ξανά αργότερα.
Άρθρα 1–7