Accélérer le rythme du déploiement de véhicules autonomes

16 août 2019

La technologie des véhicules autonomes est en développement depuis des années, mais elle n’a pas encore été complètement commercialisée, car elle n’est tout simplement pas assez bonne. Les véhicules autonomes (AV) constituent une menace pour la sécurité humaine tant qu'ils ne sont pas aussi performants que l'homme pour détecter les obstacles et prendre des décisions à la fraction de seconde face à des événements imprévisibles - des événements tels que la décision d'une personne de jaywalk, un cycliste qui dévie éviter le nid-de-poule ou le conducteur d'un véhicule non autonome qui regarde un SMS trop longtemps. Les préoccupations relatives à la sécurité des personnes retardent la prolifération des véhicules récréatifs, mais je proposerai une solution permettant de mettre les véhicules autonomes en circulation plus rapidement. Je ferai également quelques commentaires sur l’efficacité et les limites de l’intelligence artificielle dans l’alimentation du «cerveau» numérique derrière les véhicules audiovisuels.

Un véhicule audiovisuel est un véhicule conçu de telle sorte qu’une plate-forme technologique se charge de faire naviguer un véhicule de A à B sans intervention humaine autre que lorsque le passager spécifie une destination (et que votre calendrier Google synchronisé n’enverra pas longtemps. cette information au véhicule pour vous). Un véhicule audiovisuel peut transporter des personnes ou des marchandises et nous les voyons maintenant sur les routes dans des centres d’innovation tels que la Silicon Valley, surveillés de près par le conducteur.

En tant que chef de produit, j'adorerais assumer la responsabilité de mettre sur le marché un produit aussi impressionnant que le matériel audiovisuel dès que cela est humainement possible. À l'inverse, je suis frustré et impatient de la vitesse à laquelle le secteur semble progresser dans cette direction. . La technologie audiovisuelle va changer notre monde avec une force qui rivalise avec peu d'innovations récentes, et les audiovisuels vont devenir le principal produit de l'économie de partage. Dans l'esprit du chef de produit, à la fin de cet article, je propose un moyen de mettre les véhicules audiovisuels sur nos routes le plus rapidement possible, et plus rapidement que le rythme auquel le développement de cette technologie semble évoluer aujourd'hui.

Les fonds disponibles pour les véhicules audiovisuels prêts à être commercialisés ne manquent pas, alors pourquoi cela n’est-il pas encore arrivé?

C’est évidemment une question de sécurité. L’idée qu’une machine autonome capable de nuire à soi-même puisse nuire à l’être humain nous met mal à l’aise. Les ingénieurs peuvent obtenir des véhicules audiovisuels fonctionnant à des taux de sécurité très élevés, mais pas à des taux parfaits. Alors, quand (gouvernements et industrie) déciderons-nous que ces véhicules sont suffisamment sûrs? C’est une question difficile. Selon l'OMS, plus d'un million de personnes ont péri sur les routes du monde entier en 2018. Une fois commercialisée, la prolifération de la technologie audiovisuelle fera chuter ce nombre. Mais malgré cette amélioration, certaines de ces fatalités seront inévitablement causées par des AV - par des machines. Nous entendons à peine parler d'un mort sur la route impliquant des conducteurs humains, mais un seul décès récent impliquant un véhicule audiovisuel a attiré l'attention des médias l'an dernier. Peut-être que dans le futur, chaque véhicule sur la route sera un véhicule audiovisuel et que les piétons et les cyclistes disposeront de leur propre espace. Théoriquement, dans ces conditions, il ne pourrait y avoir aucune mort routière induite par AV. Mais jusqu'à ce moment-là, nous allons devoir nous habituer à la fatalité occasionnelle. Si les ingénieurs en logiciel font bien leur travail, ces morts seront la faute des humains partageant les routes beaucoup plus souvent que la faute des véhicules audiovisuels.

Alors, que font les ingénieurs pour éliminer les accidents causés par les logiciels audiovisuels? L'apprentissage automatique est fortement utilisé dans ce processus. Une différence entre l’apprentissage automatique et les formes les plus primordiales d’intelligence informatique réside dans le fait que les logiciels informatiques plus anciens constituaient jadis une vaste collection de règles et un ensemble d’entrées et de sorties pouvant être communiquées de manière compréhensible pour une machine.

Mais le logiciel intelligent qui propulse les véhicules audiovisuels devra faire quelque chose que les anciens logiciels n’avaient pas fait: interpréter le paysage «visuel». Les cerveaux audiovisuels devront identifier des objets dans nos rues à l'aide de caméras et de capteurs: voitures, vélos, nids de poule, cyclistes, caddies, boîtes aux lettres, bordures de rue, allées et de nombreux autres objets attendus et moins attendus sur la route. Et comment l’apprentissage automatique «apprend-il» cela? Il apprend en analysant des millions d'images de ces objets. Lorsque vous terminez un exercice ‘CAPTCHA’ sur un site Web où il vous est demandé d’identifier toutes les images d’un arbre (par exemple) à partir d’une grille de neuf images, vous faites partie des millions de personnes qui aident une machine à apprendre. L’un des défis des écrans visuels est que les machines n’interprètent pas le contenu d’une image aussi bien que les humains. Ce ne sont là que quelques-uns des éléments qui créent d’énormes variables dans les images: proximité de l’objet, lumière, mégapixels de l’appareil photo, vitesse d’ouverture, qualité de l’air et immobilité des mains, pour ne nommer que ceux-ci. Une personne ayant une vision décente peut interpréter la gamme d'objets trouvés sur la route beaucoup plus efficacement qu'une machine.

En exploitant la puissance de millions d'humains interprétant des images d'arbres, de voitures, de camions, de passages pour piétons et de feux de signalisation, les logiciels audiovisuels apprennent rapidement à identifier les obstacles sur la route. Est-ce vraiment l'intelligence et l'apprentissage? Je ne peux pas m'empêcher de penser que, même si les ingénieurs en logiciel ont incorporé le concept d'une bouche d'incendie à une machine en lui montrant d'innombrables images de cet objet, cette sorte d'apprentissage est un apprentissage par cœur plutôt que l'apprentissage par inférence et par déduction - ce que je appellerait la vraie intelligence.

Nous appelons cela l’apprentissage automatique, mais enseignons-nous aux machines comment apprendre? Nous pouvons tous témoigner de l’uniformité des rues, des arbres, des trottoirs et des autres piliers de la route bien photographiés de la Silicon Valley. C’est un bon point de départ pour développer un logiciel permettant de naviguer en toute sécurité dans un système audiovisuel. Mais les ingénieurs devront-ils capturer CAPTCHA dans le reste du monde - ce qui est si différent de la Silicon Valley, avant que les SDV ne valent la route? Combien plus colossal d'un effort d'apprentissage machine sera nécessaire avant que les véhicules audiovisuels puissent partager les routes en toute sécurité dans les villes dont les intersections ressemblent à ceci:

Que peut-on faire alors pour mettre la technologie audiovisuelle sur le marché rapidement et sans rendre nos routes plus dangereuses? Ma solution est itérative, mais donne des résultats immédiats. L'industrie audiovisuelle devrait se concentrer davantage sur le transport de passagers et sur le transport routier de marchandises par semi-remorques. Uber, Waymo et toutes les autres entreprises à la recherche de cette technologie devraient acquérir des parcelles de terrain immédiatement à la sortie d'autoroute dans les limites de la ville. Sur ces parcelles de terrain, les conducteurs humains doivent attendre l'arrivée de semi-remorques à conduite autonome en provenance de l'autoroute. Le conducteur embarque alors et prend le contrôle du véhicule pour l'amener aux derniers kilomètres compliqués de la ville jusqu'à la destination finale. . Les conducteurs apporteraient également des remorques vides et pleines aux points d’accès autoroutiers où la technologie audiovisuelle peut prendre le relais et envoyer le véhicule à sa prochaine destination sur l’autoroute.

Les autoroutes contiennent beaucoup moins de variables à interpréter par les logiciels que les rues de villes. Il n'y a pas de bornes d'incendie, de voitures en stationnement, de cyclistes ou de véhicules à double stationnement. Et, avec la hauteur d'une semi-remorque, les capteurs montés vers le haut de la remorque devraient facilement être capables de balayer assez loin pour détecter les changements brusques de la circulation et les dangers. Je crois que l’environnement limité et contrôlé d’une autoroute est le lieu idéal pour mettre la technologie audiovisuelle sur le marché en premier, et je pense qu’un logiciel fiable et efficace à cet effet peut être prêt très bientôt, s’il n’est pas déjà disponible. Une fois commercialisées, les quantités considérables de données recueillies lors des trajets de semi-remorques audiovisuelles seront très utiles aux entreprises travaillant dans le transport de passagers et les aideront à atteindre plus rapidement leur objectif de transport autonome de passagers.