Abstract:
L’apprentissage par renforcement est un type d’apprentissage machine qui permet à un agent
d’apprendre un comportement qui n’a jamais été préalablement défini par l’homme. L’agent découvre
l’environnement et les différentes conséquences de ses actions à travers des interactions avec celui-ci.
Ce mémoire s’intéresse à l’application de l’un des algorithmes d’apprentissage par renforcement,
à savoir Deep Q-Network, pour faire un ajustement automatique des paramètres d’un régulateur
Proportionnel-Intégral-Dérivé. Cet algorithme utilise des réseaux de neurones pour définir sa
politique, son environnement est la boucle de régulation, son état est défini par les performances de
la réponse indicielle et ses actions consistent à modifier les paramètres du régulateur PID.
Cet algorithme prend en compte les exigences du cahier des charges, et fait la régulation sans
nécessairement savoir la fonction de transfert du système à régler.