Conception d'une IA physique _Robotique humanoïde : les clés de la réussite

Robot domestique Neo

IA physique, robotique humanoïde : Quelles sont les clés du succès ?

Les modèles d’IA que vous utilisez s’étendront bientôt au monde physique, grâce à la réduction de l’échelle des processeurs informatiques d’IA, à une communication fluide en temps réel avec les humains en langage naturel et à une perception multimodale de l’environnement. Cela inclut le texte et les images 3D, ainsi que les sons, les vibrations, les couleurs, les odeurs, le retour de force lors de la préhension, ainsi que tout ce qui est lié aux signaux humains tels que la parole, les mouvements et les émotions exprimées sur les visages et dans les voix.

L’IA va bouleverser la robotique. Ce que l’on appelle aujourd’hui l’IA physique englobe la perception, la prise de décision autonome en temps réel qui tient compte de l’environnement, ainsi que l’action. Elle sera le moteur de l’équipement de demain, qu’il prenne la forme d’une machine ou d’un robot humanoïde.

La dimension que les concepteurs d’IA physique doivent ajouter est la relation avec les humains. Car au-delà du simple fait de donner des ordres, l ‘homme fait partie intégrante du système machine-homme. L’ampleur avec laquelle les smartphones ont transformé nos vies préfigure d’autres changements à venir avec l’IA physique.

En tant que praticiens du design industriel et du marketing de l’innovation, nous proposons une approche visant à rendre l’IA physique pertinente, acceptable et désirable, en travaillant dès la phase de conception sur deux nouveaux domaines :

  • Éditorialisation des données d’entraînement à l’IA.
  • Donner aux robots des traits de personnalité clairs pour faciliter leur adoption, car nous comprenons intuitivement comment interagir avec eux.

Pour mettre votre projet d’IA physique sur la voie de la réussite, lisez ce qui suit !

1-L’échelle d’autonomie actuelle : Une échelle dont la finalité est de supplanter l’homme

Jusqu’à présent, l’autonomie des systèmes a été mesurée à l’aide d’une échelle standardisée qui évalue la capacité d’un système à agir sans intervention humaine. Le tableau ci-dessous compare les niveaux d’autonomie de trois systèmes : les voitures, les trains et un système de contrôle et de commande basé sur l’IA.

NiveauAutomobileTrainContrôle et commande
0Le conducteur garde le contrôle total du véhicule. Tout est manuel Pas d’automatisation : Les humains font tout
1Le véhicule peut contrôler la vitesse ou la direction dans certaines conditions, sous le contrôle total du conducteur.Soutien analytique : Les humains prennent des décisions avec un soutien analytique
2Le véhicule peut contrôler la vitesse et la direction dans certaines circonstancesGoA1 train à commande manuelle équipé d’un système empêchant les excès de vitesse
Soutien stratégique : Les humains prennent la plupart des décisions, avec l’aide de l’IA
3Le véhicule effectue la plupart des tâches, mais seulement dans certaines conditions. Dès que le système n’est plus en mesure de conduire, le conducteur doit reprendre le contrôle. GoA2 assure le contrôle automatique de l’accélération et du freinage du train. Le conducteur dans la cabine reste responsable de la sécurité et de la détection des obstacles. Il gère les portes, le départ et les imprévus Supervision humaine structurée :
Les humains sont responsables des décisions de l’IA.
4Le véhicule décide dans la plupart des situations. Le conducteur intervient dans certains cas Le train GoA3 est un train entièrement automatique qui contrôle la traction et le freinage, ainsi que la détection des obstacles. Il surveille l’état du train et détecte les problèmes dans l’environnement. Il n’est pas nécessaire qu’une personne soit présente en permanence dans la cabine de conduite. Analyse pilotée par l’IA : les humains n’interviennent que dans des cas exceptionnels
5Voiture entièrement autonome, sans pédales ni volantGoA4 le train est capable de tout gérer et n’a pas de personnel à bordCollaboration autonome : Les humains se concentrent sur les tâches stratégiques

2 – Une métrique techno-centrée

Ces échelles sont indispensables pour marquer le progrès technologique et réduire le taux d’erreur de décision du système. Mais dès que le système devient plus performant que l’homme, elles ne suffisent plus.

  • L‘humain est dépouillé de ses prérogatives de contrôle et de commande : c’est une vision anxiogène qui suscite le rejet. Les véhicules autonomes en sont un exemple : au cours des dix dernières années, ils ont suscité beaucoup de perceptions négatives, alors qu’ils font beaucoup moins d’erreurs par kilomètre parcouru que les humains. L’idée des véhicules autonomes va à l’encontre de notre conviction que nous sommes de bons conducteurs. Globalement, entre 80 et 93 % des automobilistes se jugent positivement, quelle que soit la réalité du risque routier ou le niveau des infractions locales. Même les personnes âgées, dont les capacités de conduite se dégradent, sont rebutées par l’idée de véhicules totalement autonomes, alors qu’elles apprécient les aides à la conduite qui compensent leurs déficiences.
  • Une fois les performances techniques visées atteintes, le défi de l’IA physique est clair : créer des machines qui préservent ou améliorent les capacités humaines. En prétendant libérer l’homme de la « pénibilité » de la conduite, elle remet en cause notre rapport intime à la conduite : quid du détour impromptu au gré de l’humeur et des circonstances ? Malgré son image ternie par l’urgence écologique, la voiture reste le symbole de l’autonomie humaine. Pour être adoptée, la voiture autonome ne devra pas seulement respecter le code de la route et éviter les accidents, elle devra assumer son rôle d’objet social et se comporter en accord avec les humains qui l’entourent.
  • Une voiture autonome est conçue en fonction de son environnement social :
    • Il aura un impact sur les automobilistes dans la circulation. Certains, par exemple, lui conféreront le statut de véhicule au sommet de l’échelle sociale, méritant déférence et priorité.
    • Il aura un impact sur les habitants des quartiers qu’il traverse. Il est facile d’imaginer des adolescents tester ses limites en lançant délibérément un ballon devant elle. Mais d’autres, moins bienveillants, pourraient y voir une cible idéale pour exprimer leur frustration. Dans ce cas, la voiture autonome ne devrait pas être laissée sans surveillance dans la rue…
    • Ses décisions en situation de précollision ont des conséquences sociétales : si la voiture ne peut pas s’arrêter, vaut-il mieux écraser les enfants ou l’adulte qui les accompagne ? La réponse à ce dilemme éthique varie d’un pays à l’autre.

3-Développer les interactions avec les humains sur différents fronts

L’analyse du comportement des utilisateurs d’IA révèle une forte interaction homme-machine. Une étude publiée en décembre 2025 sur les usages de 37,5 millions de Copilotes Microsoft montre à quel point les utilisateurs ont intégré l’IA dans leurs activités personnelles et professionnelles, faisant du Copilote un véritable compagnon de vie pour leur travail, leurs questions existentielles ou encore leurs difficultés relationnelles.

Le psychiatre Raphaël Gaillard a identifié trois causes profondes à cette relation : « À l’époque préhistorique, pour survivre, […] les humains devaient comprendre les actions et les réactions des animaux sauvages. Face à quelque chose doté d’une forme d’intelligence, nous sommes confrontés à une asymétrie d’information : il nous est impossible de connaître l’étendue de cette intelligence, dont nous ne percevons que quelques effets visibles, […] nous nous méfions en considérant que cette intelligence pourrait nous surprendre, et supposons donc qu’elle est grande. Vient ensuite une troisième étape, dans laquelle cette intelligence se révèle capable de dire quelque chose de pertinent. À tout le moins, son comportement, semblable au nôtre, nous rappelle ce que nous savons de nous-mêmes, ce qui n’est pas grand-chose, créant ainsi un lien de fraternité, ou du moins un sentiment de fonctionnement partagé. Cette similitude jette les bases d’une relation dont l’intensité ne doit pas être sous-estimée. De plus, si cette intelligence s’avère capable de décrire notre fonctionnement […], nous éprouvons à son égard un sentiment encore plus profond. Un mélange de peur, mais aussi d’affection ».

La conception des robots dotés d’IA doit tenir compte de ces risques et opportunités anthropologiques. Elle doit embrasser nativement de toutes nouvelles dimensions telles que :

  • Le rôle des signaux sensoriels et des émotions dans la prise de décision humaine.
  • Les rituels de transfert de pouvoir entre les humains et les machines : Comment la machine ramène-t-elle l’utilisateur dans le circuit lorsqu’il est temps pour lui de reprendre le contrôle ? Comment s’assure-t-elle que l’utilisateur n’est pas endormi ?
  • Le besoin de boucles d’apprentissage pour aider l’utilisateur à progresser.

Cette liste d’opportunités est loin d’être exhaustive ! Blocs opératoires d’hôpitaux, écoles, centres d’éducation spécialisée, ateliers industriels, laboratoires, salles de sport, vignobles, zones de combat, points de vente : la variété des cas d’utilisation et des utilisateurs déterminera la manière de mesurer la performance, que ce soit celle de l’utilisateur, de la machine ou du tandem homme-machine.

Le tableau ci-dessous imagine ce que pourrait être une échelle de performance, basée sur la capacité du système à enseigner à l’homme dans le contexte du traitement de texte ou de la conduite. Cette échelle a deux objectifs économiques :

  • réduire le temps de formation initiale des utilisateurs de la machine, en se concentrant sur les principes fondamentaux pour une maîtrise rapide, puis en introduisant progressivement des concepts plus avancés.
  • rendre plus attractifs certains emplois qualifiés pour lesquels il est difficile de recruter.
Échelle d’apprentissageTraitement de texteVoiture auto-école
0 Contrôle et commandeL’utilisateur doit d’abord apprendre à se servir de la machineMachine à écrire manuellePas d’assistance à la conduite
1AdaptationLa machine est configurée par l’utilisateur pour une adaptation optimale à ses besoins et à son contexte d’utilisationParamètres de traitement de texte (langue, taille et police de caractères)La voiture alerte le conducteur en cas de situation ou de comportement dangereux.
2AssistanceLa machine corrige certaines erreurs de l’utilisateur ou prolonge efficacement ses intentionsCorrection automatique de l’orthographe et de la grammaireLa voiture évite les erreurs : correction de la stabilité, freinage d’urgence, etc.
3CompagnonLa machine aide les utilisateurs à prendre des décisions sur la base d’un ensemble de connaissances de référence et de données historiques : plus les utilisateurs travaillent avec la machine, plus ils l’améliorent. La machine répond aux questions de l’utilisateur Interface adaptée au niveau de l’utilisateur.
Amélioration de la grammaire et du style, adaptation de la langue au contexte et aux lecteurs cibles.
La voiture propose des améliorations au conducteur. L’instructeur fixe des priorités en fonction du profil de ses élèves.
4FormationLa machine évalue ce qui a été produit, les écarts et les déviations. Elle suggère des domaines d’amélioration et propose des fonctions avancées Évaluation de la qualité du texte par un tiers ou des lecteurs.
Retour d’information, contrôle de la qualité en temps réel et final
La voiture fait passer l’examen de conduite.
L’instructeur délivre le permis de conduire.

4-Pour l’IA physique pertinente, éditorialiser les données d’entraînement

Une autre étape est nécessaire dans la phase de conception : sélectionner et indexer soigneusement les ensembles de données pour entraîner l’IA physique.

Prenons, par exemple, la conception d’un garrot pour les premiers soins à donner à un soldat blessé sur le front. Le concepteur souhaite utiliser l’IA générative pour développer le meilleur produit. La première difficulté réside dans le fait que l’utilisation d’une IA généraliste à source ouverte n’est pas possible dans le secteur militaire, car les données sur le terrain sont classifiées et les messages doivent rester confidentiels. Dans une IA propriétaire spécialisée, les données d’entraînement devront être sélectionnées, formatées et dûment classifiées : origine des données, contexte, qualité, biais potentiels, traçabilité des versions.

Dans le contexte de la santé, l’éditorialisation des données d’entraînement sera nécessaire pour se conformer à la réglementation européenne sur la sécurité de l’IA. Les modèles d’IA entraînés sur des sources de données médicales fiables, bien indexées et contextualisées, prouveront leur pertinence. Les données d’entraînement combineront des informations provenant de produits de premiers soins médicaux et d’opérations de combat. D’autres données contextuelles telles que les blessures corporelles, les équipements, etc. peuvent être ajoutées. La tâche du concepteur consistera à naviguer dans plusieurs mondes et contextes, et à sélectionner la meilleure proposition d’IA générative, sur la base d’un compromis entre l’efficacité et la facilité d’utilisation.

L’éditorialisation consiste également à priver l’IA de pans entiers d’informations de formation afin de minimiser le risque de mauvaise prise de décision, de réponses vagues ou inappropriées (hallucinations) par rapport à une tâche spécifique.

Imaginons qu’en tant que parent, vous souhaitiez développer une IA de coparentalité pour votre enfant. Nous pensons que vous serez désireux de participer au processus d’éditorialisation, à savoir :

  • Données contextuelles : Définir les thèmes à aborder, identifier les liens avec la vie scolaire, indiquer les membres de la famille et les autres personnes de confiance, préciser comment les contacter, choisir la ou les langues de communication, etc.
  • Les données de formation : Elles constituent la base des connaissances à transmettre et serviront à construire le raisonnement. Son éditorialisation comportera les étapes suivantes :
    • Filtrage thématique du corpus d’apprentissage : En limitant l’apprentissage à des sujets utiles pour l’éducation ou la vie quotidienne d’un enfant, l’IA réduit son « bruit cognitif » et produit des réponses plus stables et plus cohérentes.
    • Intégration de cadres éducatifs ciblés : En exposant l’IA à certaines valeurs, histoires, approches pédagogiques ou références culturelles, morales ou religieuses, nous pouvons orienter la manière dont elle explique, encourage ou réagit, comme si nous définissions son « style parental ».
    • Exclusion de certains sujets sensibles : En supprimant du corpus les sujets tabous ou inadaptés à l’âge, nous réduisons le risque que l’IA aborde des sujets que vous souhaitez traiter vous-même. L’IA physique doit pouvoir dire : « Je ne sais pas, demandez à votre mère ou à votre père ».
    • Pondération des contenus prioritaires: En mettant l’accent sur certains types de contenus, nous renforçons la capacité de l’IA à éduquer l’enfant dans ces domaines spécifiques.
    • Construire des scénarios réalistes d’utilisation quotidienne: En entraînant l’IA à des situations concrètes (devoirs, conflits, routines, émotions, questions existentielles), nous améliorons la pertinence et la prévisibilité de ses réponses dans des situations de la vie réelle.

5-Faciliter l’adoption en donnant au robot une personnalité claire

Un robot doté d’une IA doit être considéré comme un agent social: parfois un simple marqueur de présence, parfois un membre à part entière d’un système relationnel plus vaste. Il n’existe pas seulement lorsque nous lui parlons ; il existe avec nous, dans un continuum d’attentes, de signaux et de comportements. Au moment de choisir votre premier robot domestique, la grande majorité d’entre vous choisira peut-être de ramener à la maison Neo, humble et familier (voir l’image en bas à droite), plutôt qu’Optimus, un robot domestique et multifonctionnel développé par Tesla (en bas à gauche), à l’allure affirmée et dominatrice.

Qui sait, après plusieurs années de cohabitation, nous pourrions même suivre les ordres de l’IA physique !

Le concepteur du système d’IA physique doit spécifier l’interaction avec les humains :

  • Le robot est-il social ? Dans l’affirmative, comment les humains doivent-ils se sentir lorsqu’ils le voient ? Quelles sont les tâches qu’il est encouragé à accomplir ?
  • Doit-il faire preuve d’empathie ? À quel degré ?
  • Sa mission est-elle la sécurité, la présence rassurante, le contrôle de la qualité, l’enseignement ou l’exécution de tâches manuelles ? Est-il expert ou multitâche ?

Le cas du robot de surveillance Rotunbot ET-G, testé en 2025 par la police de Wenzhou en Chine, est éloquent : Inspiré du film Rubber (2010) de Quentin Dupieux, qui met en scène un pneu auto-roulant qui tue tout humain sur son passage, ce robot-pneu est conçu pour aider la police à poursuivre et à arrêter des individus. Il est équipé de différentes fonctions de poursuite, de combat et de capture. Mais surtout, en s’appuyant sur l’imaginaire d’un film, les concepteurs ont cherché à amplifier le pouvoir dissuasif du robot.


6- Pour les grandes marques, l’IA physique représentera une formidable opportunité : offrir à leur public une expérience immersive.

Des possibilités illimitées s’ouvrent en termes de communication de marque. Prenez le cas du fabricant de pneus Michelin, connu dans le monde entier pour son personnage centenaire Bibendum. L’IA physique de Bibendum pourra s’adresser directement à tous ses publics, de manière personnalisée et interactive : aux enfants pendant le Tour de France cycliste (en bas à gauche), ou aux acheteurs de pneus qui ont besoin de comprendre pourquoi les pneus Michelin justifient un prix plus élevé (en bas à droite).

L’IA physique de la marque permettra également d’interroger les clients en langage naturel, de recueillir leurs avis et suggestions, de promouvoir les produits de la marque et de créer ainsi une expérience mémorable.

L’éditorialisation des données de formation est d’autant plus aisée que ces grandes marques ont été soigneusement caractérisées en termes d’univers, de mission, de rôle, de traits de personnalité, de valeurs, de contextes d’utilisation et de champs de légitimité. De plus, elles ont accumulé un trésor de données de formation : visuels et films publicitaires, éditoriaux, argumentaires promotionnels, contenus du service client, guides d’utilisation, etc.

L’IA physique intégrera certainement des héros de jeux vidéo, de bandes dessinées, de films, de contes, de mythes et d’histoires, tels que les personnages de Walt Disney ou d’Harry Potter. Elle représentera également des personnages réels, historiques ou contemporains : mannequins de grandes marques de luxe, stars et célébrités, hommes politiques de premier plan et chefs d’entreprise. En 2025, l’Albanie a nommé un premier ministre généré par l’IA ! Et ce n’est qu’un début.


7- Facteurs de succès dans la phase cruciale de conception

Le défi pour les concepteurs des futurs systèmes d’IA physique est de les intégrer dans un écosystème humain et de concevoir non seulement ce qu’ils font, mais aussi ce qu’ils sont et la place qu’ils occupent dans nos sociétés.

La nécessité d’un cadre éthique croît avec l’intensité de la relation avec l’utilisateur : L’IA a souvent été utilisée pour attirer sans relâche l’attention des téléspectateurs, car le modèle économique était basé sur la publicité ciblée. Des choix de conception délibérés ont entraîné une dépendance chez les utilisateurs, en activant à l’excès les circuits de récompense du cerveau et en injectant un flux continu de stimuli.

Avoid the trap of designing physical AI solely for moments when it interacts with the user or the surrounding world. A good practice is to consider the object outside of its period of use – for recharging and storage – as well as its reaction to bad weather, intrusion, or vandalism.

La phase de conception devrait dépasser les disciplines de l’IA et de la robotique pour inclure des concepteurs créatifs, des scientifiques des données, des spécialistes du marketing, des experts du contexte d’utilisation cible, des psychologues, des historiens, etc.

Retour en haut