Une éclaircie illumine Santa Monica Boulevard en cette fin de matinée de janvier. À Los Angeles, la nouvelle année a commencé sous des trombes d’eau. Mais dès que le Soleil perce à travers les nuages, les Californiens retrouvent le goût d’arpenter les rues du quartier. À cinq minutes de la plage de Santa Monica se dresse un immeuble de bureaux au pied duquel un food truck vend des tacos aux promeneurs. À contre-cœur, je détache mon regard des tortillas remplies de carne mechada pour passer la porte. J’ai rendez-vous au sixième, chez Josh.ai. Aucun mal à trouver : sur la porte d’entrée, les lignes blanche de leur logo en forme de tête de chien se détache sur un fond jaune chaleureux. Nader Dajani, le directeur des ventes de la jeune société, m’accueille avec un sourire et m’invite à entrer. Derrière lui, les baies vitrées de l’open space donnent sur l’océan Pacifique d’un côté, et de l’autre sur les collines d’Hollywood, avalées par la grisaille. « C’est tragique », commente-t-il. « Josh, mets un peu de musique pour nous remonter le moral. » Une voix masculine teintée d’un fort accent british sourd de l’Amazon Echo posée sur le rebord de la fenêtre. « Avec plaisir ! » À côté de l’appareil, une enceinte Sonos joue les premières notes d’un morceau des Red Hot. Nader nous sert des cafés et donne le ton de la conversation. « Ce que Mark Zuckerberg a mis un an à concevoir, on l’a fait en trois semaines. »

Nader Dajani
Crédits : Josh.ai

Les secrets de Jarvis

C’est vrai qu’il aura fallu près d’un an à Mark Zuckerberg pour accomplir son grand défi de l’année 2016. Après avoir lu 25 livres en 2015 (à raison de deux par mois) et avant de visiter chacun des 50 États que comptent les USA (il s’est lancé ce nouveau défi le 3 janvier dernier), le fondateur de Facebook a construit son propre Jarvis. Enfin, « un peu comme Jarvis ». Jarvis, c’est l’assistant intelligent de Tony Stark dans Iron Man. Son prénom est l’acronyme de Just A Rather Very Intelligent System, « un système plutôt très intelligent, tout simplement ». Une intelligence artificielle ultra-perfectionnée qui assiste Stark dans son travail et accomplit ses moindres tâches domestiques. L’IA est multifonction, infiniment intelligente, dotée d’une personnalité unique et d’interfaces à l’ergonomie inégalable : un Graal technologique qui fait languir tous les pontes de la tech contemporains. Le 20 décembre dernier, Zuckerberg a annoncé sur Facebook qu’il avait accompli sa mission, celle de créer une IA simple pour rendre sa maison intelligente. Et quoi de mieux pour le prouver qu’une vidéo de démonstration tournée chez soi ? Plus de 25 millions de personnes l’ont visionnée rien que sur sa page, elle ne vous aura sûrement pas échappé. Peut-être n’avez-vous pas vu les deux autres démos qu’il a sorties plus tard le même jour pour présenter Jarvis du point de vue de son épouse, Priscilla Chan, et le lendemain du point de vue de Jarvis lui-même. Le résultat donne terriblement envie : une intelligence artificielle qui parle avec la voix de Morgan Freeman (ou Arnold Schwarzenegger, au choix) et aide les Zuckerberg dans toutes leurs tâches domestiques au moyen de commandes vocales naturelles. Jarvis fait même des blagues.

Mark Zuckerberg et Morgan Freeman, la voix de Jarvis
Crédits : Mark Zuckerberg/Facebook

Naturellement, nombreux sont ceux qui veulent leur propre Jarvis à la maison. Mais à ce propos, il y a une bonne et une mauvaise nouvelle. Commençons par la mauvaise : le Jarvis de Zuckerberg n’existe pas vraiment. En vérité, Mark Zuckerberg n’a inventé que ce qu’il s’était promis d’inventer : un assistant personnel grâce auquel il peut automatiser un certain nombre de tâches domestiques via des commandes vocales. Par le biais d’une application mobile, il peut faire une variété de choses, comme demander à son assistant d’allumer ou d’éteindre les lumières ; d’ouvrir ou fermer la porte de son garage ; de passer de la musique ; de lancer une machine ; ou de le prévenir quand quelqu’un est à la porte – Jarvis reconnaît le visage de certaines personnes. Se lancer dans le développement d’un tel système était un moyen pour Mark Zuckerberg de dresser un état des lieux des possibilités actuelles en matière d’intelligence artificielle, comme il l’a révélé dans un post de blog intitulé « Fabriquer Jarvis ». Il conclue qu’en matière d’IA, nous sommes « plus loin que les gens ne l’imaginent, mais encore loin du but ». C’était aussi l’occasion pour le milliardaire de faire le tour d’un domaine technologique à priori très peu sexy : la domotique. Car l’équation se réduit à ça : une seule application de commande vocale pour gouverner tous les objets connectés de votre maison. Technologie fort utile quand on fait partie des 1 % les plus riches de la planète, mais encore à des années-lumière du quotidien pour le reste du monde. Pour concevoir Jarvis, Mark Zuckerberg a utilisé le meilleur des systèmes d’intelligence artificielle développés par les ingénieurs de Facebook : une IA dotée des dernières avancées en matière de traitement du langage, de reconnaissance vocale et de reconnaissance faciale. Elle permet à l’utilisateur d’accéder sans effort à ses systèmes connectés. Lorsque Zuckerberg commande à Jarvis de passer « de la musique qui plaira à toute la famille », le serveur transmet l’information à une enceinte sans fil Sonos, et passe en revue les playlists de son compte Spotify pour jouer un morceau adapté. Lorsqu’il lui demande de régler la température d’une pièce, de fermer la porte du garage ou d’afficher sur son écran les écrans de ses caméras de surveillance, c’est encore moins magique : l’assistant transmet l’ordre à un système Crestron, qui se charge du reste. Mark Zuckerberg n’a pas eu à remuer ciel et terre pour dégoter Crestron Electronics.

L’entreprise du New Jersey est le leader mondial de la fabrication de systèmes automatisés. Ils équipent déjà les bureaux de grandes entreprises de la Silicon Valley, comme Facebook et Microsoft. « Les appareils électroniques sont omniprésents dans les maisons des super-riches », dit John Clancy, le vice-président de la branche résidentielle de Crestron Electronics. « Nos systèmes équipent les maisons de plusieurs milliardaires, comme celle de Richard Branson dans les Caraïbes ou certaines propriétés de Donald Trump. » Ainsi que la maison des Zuckerberg, donc. « Lui et sa femme voulaient pouvoir compter sur la fiabilité d’un système qui a fait ses preuves, tout en ayant la capacité de le personnaliser pour les besoins de Jarvis », poursuit John Clancy. Les systèmes de Crestron sont faits sur mesure pour leurs clients les plus prestigieux. C’est le secret du pistolet lance t-shirts qu’on peut voir dans la vidéo virale du patron de Facebook. Lorsque le milliardaire prononce les mots « fresh shirt », Jarvis déclenche automatiquement le pistolet. L’installation a été réalisée par Crestron Electronics et Morgan Freeman a enregistré quatre mots pour l’occasion : « Fire in the hole. » Mais naturellement, le canon ne se recharge pas tout seul ; le système a été mis au point spécialement pour la vidéo, pas pour une utilisation quotidienne. Dans son post de blog, Mark Zuckerberg avoue aussi n’avoir pas encore équipé toutes les pièces de sa maison avec Jarvis. Et il a rapidement atteint les limites de ses capacités. « J’ai passé environ 100 heures à fabriquer Jarvis cette année », écrit-il. « Mais même si je passais 1 000 heures de plus à travailler dessus, je ne serais probablement pas capable de concevoir un système qui puisse apprendre de nouvelles compétences par lui-même – à moins que je ne fasse une découverte fondamentale en matière d’IA en chemin. » John Clancy ajoute que les systèmes développés par Crestron fonctionnent aussi bien avec des assistants personnels comme Alexa ou Siri. Moralité ? À part un casting imbattable, Jarvis n’a rien de plus que ses cousins, si ce n’est qu’il divertit la famille Zuckerberg depuis plus d’un an. Et contrairement à eux, il ne semble pas devoir être commercialisé. Voilà pour la mauvaise nouvelle. La bonne, c’est qu’un autre petit génie a déjà inventé mieux : son Jarvis s’appelle Josh et c’est un chien.

En mouvement

Le morceau parfait pour la lecture de ce chapitre ^^ Alex Capecelatro n’a pas de temps à perdre. Le jeune fondateur de Josh.ai n’a jamais eu de goût pour ça. Originaire de la banlieue de New York, il a commencé tôt, vite et fort. À 12 ans, il a deux passions : la création de sites web et le BMX. Comme Alex est logique, il crée un site pour les amateurs de cyclisme extrême. L’audience décolle, il investit dans la pub, fait des bénéfices et lance une marque d’accessoires de BMX accompagnée d’un magazine, Logic. Logique. Tout en continuant à rider et hacker tout ce qu’il peut, Alex s’adonne à une troisième passion dans la cave de la maison de ses parents : la chimie. Mais n’allez pas vous imaginer qu’il utilisait des kits de chimistes pour enfants. Alex Capecelatro est encore au collège quand il publie ses premiers articles académiques. À 16 ans, il abandonne l’école pour aller travailler dans un laboratoire de nanotechnologie du gouvernement à Washington. Il travaille pendant cinq ans comme chercheur pour différents clients, parmi lesquels la NASA et Harvard. « Travailler pour le gouvernement est excitant, mais on ne peut pas en parler », dit-il en avalant une bouchée de son burger végétarien. On parle dans un restaurant bruyant de l’hôtel Venetian, à Las Vegas. Dehors, les galeries baroques grouillent de touristes venus dilapider leurs économies dans les machines à sous rutilantes du casino. Alex Capecelatro est ici pour affaires. Il a passé la journée dans une suite de l’hôtel à présenter son produit à de potentiels investisseurs venus du monde entier. Son produit, c’est Josh, un agent intelligent qui équipe les maisons de clients friqués un peu partout aux États-Unis, de la baie de San Francisco aux quartiers résidentiels de Denver, où la société a son siège. Alex a la peau pâle, des cheveux courts en bataille, des lunettes de vue à montures noires et l’élocution rapide. Il rappelle un peu Zuckerberg. En plus costaud.

Alex Capecelatro
Crédits : Josh.ai

Il déglutit avant de reprendre. « La vérité, c’est que je travaillais beaucoup pour le département de la Défense et que je n’avais pas envie de fabriquer des armes », dit-il. « Je voulais concevoir des technologies qui améliorent la vie des gens. » Alex démissionne, s’installe en Californie, reprend ses études et monte une entreprise de biotechnologie dans la foulée. Il a 21 ans. Le but ? Trouver un remède au diabète – il est lui-même diabétique depuis ses 12 ans. Sous sa chemise, il porte un minuscule patch qui lui administre de l’insuline sans qu’il ait besoin d’y penser. « Il y a un demi-siècle, je serais mort depuis longtemps », dit-il. « Cette conscience du fait que c’est la technologie qui me permet de mener une vie heureuse, je pense que c’est ce qui a fait naître ma vocation. » Il se croit tout près de réussir mais la start-up finit dans le mur. Il soupire, hausse les épaules et rejoint un constructeur de voitures électriques, Fisker Automotive. Voyant Tesla surgir à l’horizon et la courbe de croissance de la compagnie ralentir en plein vol, il plie bagages et lance une app à la croisée de Facebook et Tinder, At the Pool. Qu’il vend en 2015 parce qu’il s’ennuie : il a une nouvelle passion, l’intelligence artificielle. Il lance alors JStar, la start-up qui conçoit Josh. Elle fêtera ses un an en mars. Alex Capecelatro aura 30 ans en décembre.

Josh, au pied !

Josh est une intelligence artificielle basée sur une technologie sophistiquée de traitement du langage et d’apprentissage par renforcement – le niveau 2 du deep learning. Le deep learning, c’est la façon qu’on les IA modernes de s’améliorer : on les entraîne en les gavant de volumes massifs de données. Après avoir visionné des milliards de photos de chats, DeepMind, l’IA de Google, a progressivement appris à différencier les images de chats des images de choses qui ne sont pas des chats. Dans le cas de Josh, cette forme d’apprentissage lui permet d’ajouter des degrés de complexité à ses déductions. « À force de ne voir personne au bureau le dimanche matin, Josh a compris qu’on était en week-end », s’enthousiasme Alex. Le système éteint désormais automatiquement toute lumière ou appareil qui aurait été laissé allumé par mégarde. Une fonction qui s’applique aussi à son interface conversationnelle. « Ses réponses sont de plus en plus fluides et diversifiées », dit-il. « Elles tiennent compte de l’heure de la journée et d’une certaine forme de hasard. » Contrairement à Alexa, dont les « OK » monocordes peuvent vite taper sur le système, Josh ne répond pas la même chose si on lui dit bonjour cinq fois d’affilée. L’IA apprend aussi de nos goûts personnels. Lorsque je lui demande de jouer un morceau que j’aime, dans le bureau de Santa Monica, Josh choisit parmi les morceaux les plus populaires du moment. Lui dire que je déteste Ed Sheeran mais que j’adore Migos lui permettra d’affiner peu à peu ses sélections. Ainsi, lorsque Nader lui demande de passer son album préféré, il revient à Californication. À part ça, Josh est capable d’accomplir tout ce qu’accomplissent les autres assistants intelligents : allumer et éteindre les lumières, ouvrir et fermer les portes, contrôler les caméras de surveillance, ainsi que tous les appareils électroniques et électroménagers connectés. Il peut être contrôlé à distance au moyen d’une application conçue par JStar.

Dans le restaurant de Las Vegas, Alex me montre les images des caméras du bureau de Denver sur l’écran de son smartphone : ses collègues sont assis à leurs bureaux. « On peut choisir la voix de l’IA », m’explique-t-il. « À Denver, c’est une voix féminine. Elle s’appelle Samantha, comme l’OS de Her. » Son avatar a le sourire de Scarlett Johansson. Alex lui commande d’éteindre les lumières et de relever les stores de la pièce. L’ordre est immédiatement exécuté. À Denver, personne ne redresse la tête alors que les systèmes se déclenchent comme par magie – ils sont habitués. Ce n’est pas le cas de tout le monde. « Au début, notre femme de ménage pensait que les bureaux étaient hantés ! » m’a raconté Nader. Ils ont dû rassurer la pauvre femme le lendemain pour qu’elle accepte de revenir travailler chez eux. Après cette démonstration, je pose à Alex Capecelatro la question qui me taraude depuis la découverte du service : pourquoi un chien ? La raison est plus élaborée que je l’imaginais. « Que vous viviez seul-e ou en couple, l’idée d’accueillir une “personne” invisible dans votre maison m’a toujours dérangé. Et je pense que c’est inconsciemment le cas de beaucoup de gens », explique-t-il. « Imaginer que l’IA est un chien est plus amusant. » Tout un symbole : les chiens sont des animaux chaleureux et loyaux, des gardiens dignes de confiance. L’image est aussi d’après lui plus fidèle au potentiel de l’IA. « On nous présente souvent l’IA comme une forme d’intelligence supérieure, à la Jarvis. Mais ce n’est pas réaliste », affirme Alex Capecelatro. « Les intelligences artificielles actuelles sont toutes un peu débiles. » C’est pourquoi l’image du chien s’est imposée à lui : Josh connaît des tours et peut en apprendre de nouveau, mais il ne faut pas s’attendre à ce qu’il réalise des choses incroyables. « Et du coup, dès qu’il accomplit plusieurs tâches simultanément, c’est d’autant plus cool. » Même son nom, Josh, ne sort pas de nulle part. En cherchant sur Google, l’équipe a trouvé que la personnalité qui se rapportait au prénom collait parfaitement à leur idée : Josh est un type amical et timide, mais plus on le connaît, plus on le trouve attachant.

~

Quand nous nous sommes rencontrés au début du mois de janvier, l’entreprise n’avait lancé la vente de Josh que deux mois plus tôt. Pour commencer, ils ont opté pour une « approche Tesla » du marché. « Pour le moment, notre technologie est très chère et ne s’adresse qu’aux clients fortunés », dit-il. Une stratégie qui obéit à une logique simple : pour songer à avoir une maison intelligente, il faut déjà avoir une maison connectée. En France, l’institut GfK prévoit plus de 30 objets connectés par foyer en 2020, et peut-être dix fois plus d’ici 2022. « Nous allons d’abord produire un petit volume, coûteux, et les prix chuteront d’année en année, à mesure que le marché s’agrandira », explique Alex. Pour l’heure, Josh n’est pas directement vendu aux clients, mais intégré à des packs connectés par des installateurs de renom, comme Crestron Electronics. La technologie de JStar est également compatible avec de nombreuses plateformes, comme Amazon Alexa, Google Home ou Apple HomeKit. « Pour le moment, on est tout petits. Mais il se pourrait qu’un jour, nos partenaires se transforment en concurrents », dit-il.

Le packaging de Josh : une box et un iPad équipé de l’app
Crédits : Josh.ai

« Je place cette citation dès que je peux, mais elle est très vraie : “Les gens ont tendance à surestimer ce que les nouvelles technologies seront capables d’accomplir dans trois ans, mais ils sous-estiment tout autant ce qu’elles pourront faire dans dix ans” », conclue Alex Capecelatro. Nous terminons de manger avant de nous diriger vers la sortie de l’hôtel, où nous commandons chacun un Uber pour rentrer. Il ne quitte pas des yeux l’écran de son smartphone, suivant à la trace l’icône de son chauffeur. « Quatre minutes. Fais voir le tiens », dit-il en se penchant sur mon écran. Au bout d’un moment, la petite voiture de mon chauffeur reste bloquée dans une position improbable. Alex Capecelatro éclate de rire. « J’adore ces conneries ! »


Couverture : Mark Zuckerberg interagit avec Jarvis.