Champion
MaisonMaison > Blog > Champion

Champion

Jul 16, 2023

Nature volume 620, pages 982-987 (2023)Citer cet article

889 Altmétrique

Détails des métriques

Les courses de drones en vue à la première personne (FPV) sont un sport télévisé dans lequel des concurrents professionnels pilotent des avions à grande vitesse sur un circuit 3D. Chaque pilote voit l'environnement du point de vue de son drone grâce à la vidéo diffusée depuis une caméra embarquée. Atteindre le niveau des pilotes professionnels avec un drone autonome est un défi car le robot doit voler à ses limites physiques tout en estimant sa vitesse et sa localisation dans le circuit exclusivement à partir de capteurs embarqués1. Nous présentons ici Swift, un système autonome capable de piloter des véhicules physiques au niveau des champions du monde humains. Le système combine l’apprentissage par renforcement profond (RL) en simulation avec des données collectées dans le monde physique. Swift a affronté trois champions humains, dont les champions du monde de deux ligues internationales, dans des courses en face-à-face réelles. Swift a remporté plusieurs courses contre chacun des champions humains et a démontré le temps de course enregistré le plus rapide. Ces travaux représentent une étape importante pour la robotique mobile et l’intelligence artificielle2, qui pourraient inspirer le déploiement de solutions hybrides basées sur l’apprentissage dans d’autres systèmes physiques.

Deep RL3 a permis des avancées récentes en matière d’intelligence artificielle. Les politiques formés avec un RL profond ont surpassé les humains dans des jeux compétitifs complexes, notamment Atari4,5,6, Go5,7,8,9, chess5,9, StarCraft10, Dota 2 (réf. 11) et Gran Turismo12,13. Ces démonstrations impressionnantes des capacités de l’intelligence artificielle se sont principalement limitées aux environnements de simulation et de jeux de société, qui prennent en charge la recherche de politiques dans une réplique exacte des conditions de test. Surmonter cette limitation et démontrer des performances de niveau champion dans les compétitions physiques est un problème de longue date dans le domaine de la robotique mobile autonome et de l’intelligence artificielle14,15,16.

Les courses de drones FPV sont un sport télévisé dans lequel des pilotes humains hautement qualifiés poussent les véhicules aériens jusqu'à leurs limites physiques lors de manœuvres agiles à grande vitesse (Fig. 1a). Les véhicules utilisés dans les courses FPV sont des quadricoptères, qui comptent parmi les machines les plus agiles jamais construites (Fig. 1b). Lors d'une course, les véhicules exercent des forces qui dépassent leur propre poids d'un facteur cinq ou plus, atteignant des vitesses supérieures à 100 km h−1 et des accélérations plusieurs fois supérieures à celles de la gravité, même dans des espaces confinés. Chaque véhicule est contrôlé à distance par un pilote humain qui porte un casque montrant un flux vidéo provenant d'une caméra embarquée, créant une expérience immersive de « vue à la première personne » (Fig. 1c).

a, Swift (bleu) affronte Alex Vanover, le champion du monde 2019 de la Drone Racing League (rouge). La piste comprend sept portes carrées qu'il faut franchir dans l'ordre à chaque tour. Pour gagner une course, un concurrent doit boucler trois tours consécutifs avant son adversaire. b, Une vue rapprochée de Swift, éclairé par des LED bleues, et d'un drone à pilotage humain, éclairé par des LED rouges. Les drones autonomes utilisés dans ce travail s'appuient uniquement sur des mesures sensorielles embarquées, sans aucun support d'infrastructure externe, telle que des systèmes de capture de mouvement. c, De gauche à droite : Thomas Bitmatta, Marvin Schaepper et Alex Vanover pilotant leurs drones sur la piste. Chaque pilote porte un casque qui diffuse un flux vidéo transmis en temps réel depuis une caméra à bord de son avion. Les casques offrent une expérience immersive de « vue à la première personne ». c, Photo de Régina Sablotny.

Les tentatives visant à créer des systèmes autonomes atteignant les performances des pilotes humains remontent à la première compétition de courses de drones autonomes en 2016 (réf. 17). Une série d’innovations a suivi, notamment l’utilisation de réseaux profonds pour identifier l’emplacement de la prochaine porte18,19,20, le transfert des politiques de course de la simulation à la réalité21,22 et la prise en compte de l’incertitude dans la perception23,24. Le concours de courses de drones autonomes AlphaPilot 2019 a présenté certaines des meilleures recherches dans le domaine25. Cependant, les deux premières équipes ont mis presque deux fois plus de temps qu'un pilote humain professionnel pour terminer la piste26,27. Plus récemment, les systèmes autonomes ont commencé à atteindre des performances humaines expertes28,29,30. Cependant, ces travaux reposent sur une estimation d’état quasi parfaite fournie par un système externe de capture de mouvement. Cela rend la comparaison avec les pilotes humains injuste, car les humains n’ont accès qu’aux observations embarquées du drone.