Voici pourquoi votre Tesla sera bientôt une voiture autonome.

Qu'est-ce que l'apprentissage profond de Tesla et comment la société de logiciels utilise-t-elle des milliards de kilomètres pour former ses réseaux neuronaux ? Dans ce blog, vous découvrirez ce que Tesla peut faire dans le domaine de la conduite autonome que ses concurrents ne peuvent pas encore faire.

Un certain nombre de facteurs sont importants pour déterminer dans quelle mesure une entreprise peut faire en sorte que sa flotte ou son parc de voitures conduisent de manière autonome. La collecte et l'étiquetage des données sont l'un des facteurs clés qui déterminent les performances des réseaux neuronaux. Alors, qu'est-ce qu'un réseau neuronal ? Un réseau neuronal est un réseau d'émetteurs et de récepteurs qui collectent et traitent des informations.

Avec une flotte d'environ 500 000 véhicules équipés de la conduite autonome intégrale de Tesla, la flotte de Tesla parcourt environ 24 millions de kilomètres par jour, soit 8,7 milliards de kilomètres par an.

Il existe trois domaines principaux dans lesquels les données jouent un rôle dans la détermination du degré de réussite de la conduite autonome :

  • Vision par ordinateur

  • Prédiction

  • Politique de planification des itinéraires/conduite

Vision par ordinateur

La détection des objets est une tâche importante de la "vision par ordinateur". Certains objets n'apparaissent que rarement sur la route. Le grand avantage de Tesla est que ses véhicules parcourent des milliards de kilomètres par an, ce qui lui permet de recueillir de nombreux exemples d'objets et de situations rares. La Tesla est ainsi "autonome et sûre" dans toutes les situations possibles sur la route.

Andrej Karpathy, directeur de l'IA chez Tesla, explique dans cette vidéo (tirée de sa présentation lors de l'Autonomy Day) comment Tesla utilise les images pour s'entraîner à la détection des objets :

Prédiction

La prédiction est la capacité d'anticiper les mouvements et les actions des autres voitures, des piétons et des cyclistes plusieurs secondes à l'avance. Anthony Levandowski, qui a été pendant des années l'un des principaux ingénieurs de Waymo de Google, l'un des plus grands concurrents de Tesla en termes de conduite autonome, a récemment écrit que "la raison pour laquelle personne n'a atteint l'autonomie complète est que les logiciels d'aujourd'hui ne sont pas assez bons pour prédire l'avenir."

La flotte de Tesla est une source fantastique à cet égard, car c'est elle qui parcourt actuellement le plus de kilomètres en mode semi-autonome. Chaque fois qu'un Tesla fait une prédiction erronée, il envoie un "instantané de données" à Tesla. Tesla peut alors télécharger une représentation abstraite de la scène (en visualisant les objets sous forme de cubes codés par couleur et en éliminant les informations au niveau des pixels) produite par ses réseaux neuronaux de vision par ordinateur, plutôt que de télécharger une vidéo. Vous trouverez ci-dessous une image de la manière dont Tesla collecte et étiquette les données.

L'étiquetage des données ne peut être effectué que par des personnes. Un réseau neuronal peut lui-même établir des connexions entre le passé et le futur en analysant une relation de cause à effet. Ainsi, la prédiction des situations est apprise par une IA elle-même ! Voir cette vidéo où le processus est expliqué :

Comme Tesla n'a pas besoin que les employés étiquettent les situations dans tous les cas, elle peut former ses réseaux neuronaux en recueillant autant de données utiles que possible. Cela signifie que la taille des données sera en corrélation avec leur kilométrage total.

Aménagement des voies de circulation/politique de conduite

L'aménagement des voies et les politiques de conduite font référence aux actions entreprises par une voiture : rester centré sur sa voie à la vitesse autorisée, changer de voie, dépasser une voiture lente, tourner à gauche au feu vert, contourner une voiture garée, s'arrêter pour un usager de la route, etc. Il semble difficile d'établir un ensemble de règles couvrant toutes les actions qu'une voiture devrait entreprendre en toutes circonstances. Une façon de contourner cette difficulté consiste à demander à un réseau neuronal de copier ce que font les gens, ce que l'on appelle l'apprentissage par imitation.

Le processus de formation est similaire à la façon dont un réseau neuronal apprend à prédire le comportement des autres usagers de la route. Dans l'apprentissage par imitation, un réseau neuronal apprend à prédire ce que ferait un conducteur humain en établissant des corrélations entre ce qu'il voit (via les réseaux neuronaux de vision par ordinateur) et les actions entreprises par les conducteurs humains.

Tesla applique l'apprentissage par imitation à des tâches de conduite, comme la façon d'aborder les courbes abruptes d'un échangeur sur une autoroute, ou la façon de tourner à gauche à une intersection. Il semble que Tesla envisage d'étendre l'apprentissage par imitation à d'autres tâches, telles que le moment et la manière de changer de voie sur l'autoroute. Karpathy décrit comment Tesla utilise l'apprentissage par imitation dans cette vidéo :

En se basant sur les commentaires de M. Karpathy concernant la prévision des coupures, Tesla peut demander à une voiture d'enregistrer un replay si elle ne parvient pas à prévoir correctement si un véhicule qui la précède va lui couper la voie. De même, Tesla peut capturer des données lorsqu'un réseau neuronal impliqué dans la planification de l'itinéraire ou la politique de conduite ne parvient pas à prédire correctement les actions du conducteur Tesla.

D'autres moyens de capturer des images intéressantes sont le freinage ou l'embardée soudaine, le freinage d'urgence automatique, les collisions ou les avertissements de collision. Si Tesla sait déjà ce qu'elle veut capturer, comme tourner à gauche aux intersections, elle peut définir un déclencheur pour capturer une image lorsque les réseaux neuronaux de vision voient un feu de circulation et activent le clignotant gauche, ou tournent le volant vers la gauche.

Conclusion

Le défi de la conduite autonome consiste davantage à gérer les 0,001 % de kilomètres qui contiennent des cas limites rares que les 99,999 % de kilomètres qui ne sont pas remarquables. Il va donc de soi que l'entreprise qui peut collecter un grand nombre d'exemples de formation à partir de ces 0,001 % de kilomètres obtiendra de meilleurs résultats que celle qui ne le peut pas.

Nous sommes donc certains que Tesla sera le premier à généraliser la conduite autonome.