Dans cet article Dans cet article
Le coût de l’intelligence artificielle générative est devenu le sujet qui empêche la Silicon Valley de dormir. Pendant que les modèles gagnent en puissance, la facture d’électricité et de serveurs grimpe sans répit. C’est dans ce contexte tendu que Perplexity a présenté, le 2 juin 2026 au salon Computex de Taipei, un système qui promet de répartir le calcul entre votre PC et le cloud.
L’idée tient dans une métaphore que son PDG Aravind Srinivas a employée sur scène : un aiguilleur du ciel pour les tâches d’IA. Un logiciel décide, en temps réel et au milieu d’une requête, ce qui peut tourner sur votre machine et ce qui doit filer vers les centres de données. Derrière l’élégance de l’image, une question dérange : et si déléguer l’IA à nos propres ordinateurs revenait surtout à nous refiler une partie de l’addition ?
Un aiguilleur du ciel pour vos requêtes
Le principe de l’orchestrateur s’énonce simplement. Chaque tâche soumise à Perplexity est évaluée puis dirigée vers la couche de calcul la plus efficace. Les opérations légères qu’un processeur moderne avale sans peine, comme le résumé, la mise en forme ou la classification, restent sur l’appareil sans toucher le cloud. Les traitements lourds, eux, partent vers les serveurs.
La démonstration s’est tenue aux côtés du PDG d’Intel, Lip-Bu Tan, avec des modèles locaux exécutés sur des puces Intel Core Ultra Series 3. Ce sont ces modèles embarqués qui ont trié, en direct, les informations à garder en local et celles qui pouvaient rejoindre des modèles plus puissants dans le cloud. Le découpage se joue à l’échelle de la milliseconde, invisible pour l’utilisateur.
Un point compte pour qui manipule des données sensibles : selon les démonstrations rapportées par VentureBeat, le système demande l’autorisation avant d’envoyer une tâche confidentielle vers les serveurs. Perplexity revendique aussi sa neutralité matérielle, se disant compatible avec Intel comme avec les processeurs Nvidia. Reste à comprendre pourquoi cette mécanique séduit autant les industriels.
Pourquoi le tout-cloud coûte si cher
La promesse de Perplexity ne s’éclaire qu’à la lumière de la crise économique qui traverse le secteur. Plusieurs chiffres, relayés par la presse spécialisée, donnent la mesure du problème que l’orchestrateur prétend désamorcer :
- certaines entreprises dépenseraient jusqu’à un demi-milliard de dollars par mois en calcul, un ordre de grandeur que Srinivas cite pour décrire la panique ambiante ;
- les besoins en inférence saturent les centres de données au point de pousser les fournisseurs d’électricité à planifier 1 400 milliards de dollars de mise à niveau des réseaux d’ici 2030, d’après The Next Web ;
- le chiffre d’affaires de Perplexity a atteint 500 millions de dollars quand ses effectifs n’augmentaient que de 34 %, signe que l’efficacité par employé devient le nerf de la guerre.
Ce que vise Srinivas, ce n’est pas la puissance brute mais ce qu’il nomme la valeur utile par watt et par utilisateur. Déporter une partie du calcul vers les milliards de PC déjà en circulation revient à réveiller une infrastructure dormante. Cette logique rejoint un constat plus large, puisque les économies promises par l’IA tardent à se matérialiser dans les entreprises.
L’orchestration, nouveau terrain de jeu
Perplexity n’entraîne pas ses propres modèles de pointe : sa force consiste à agréger ceux des autres et à router chaque requête vers le plus pertinent. Cette position d’intermédiaire prend une dimension stratégique avec l’orchestrateur matériel, qui ajoute une couche de décision sur le lieu d’exécution. Srinivas résume sa philosophie sans détour.
L’orchestrateur, c’est un logiciel qui décide si une requête, ou une partie d’une charge de travail, est mieux traitée localement sur l’appareil, à la périphérie du réseau, ou si elle réclame la puissance supérieure des serveurs dans le cloud.
Aravind Srinivas, PDG de Perplexity, lors de l’émission Bloomberg Talks, le 2 juin 2026
Cette neutralité revendiquée, à l’égard des puces comme des modèles, ressemble à une assurance contre l’incertitude technologique. Chaque fois qu’un concurrent progresse, le système unifié de Perplexity en profite mécaniquement. C’est une rente bâtie sur les avancées des autres, un pari malin tant que l’entreprise reste un simple aiguilleur.
Ce que la bascule sur votre machine change vraiment
Présenter l’orchestrateur comme un pur progrès serait un peu court. En déplaçant une partie de l’inférence vers les ordinateurs personnels, Perplexity transfère aussi une part du coût vers l’utilisateur. Le watt consommé par votre processeur ne figure plus sur la facture de l’entreprise, mais sur la vôtre.
La qualité du service dépend alors directement de votre matériel. Un PC récent doté d’un accélérateur performant traitera vite une tâche locale, là où une machine vieillissante peinera ou renverra tout vers le cloud. Le risque, c’est de voir émerger une IA à deux vitesses selon l’équipement de chacun, où le confort d’usage se paie au prix du renouvellement du parc informatique.
La mise en scène aux côtés d’Intel mérite elle aussi un regard lucide. Le fabricant, qui domine le marché des processeurs pour PC, a tout intérêt à faire de l’ordinateur une couche de calcul incontournable pour l’IA. L’argument de la confidentialité, séduisant sur le papier, accompagne donc un intérêt commercial parfaitement assumé du côté du silicium.
L’approche répond malgré tout à une vraie tendance de fond. Nvidia a poussé au même Computex sa plateforme pour PC, et l’idée d’une IA qui s’exécute au plus près de l’utilisateur gagne tout le secteur. La facturation à l’usage des assistants pousse dans la même direction : faire payer le calcul là où il a vraiment lieu.
Local ou cloud, qui traite quoi
Pour saisir l’intérêt du dispositif, il faut regarder concrètement quelles tâches restent sur l’appareil et lesquelles montent vers les serveurs. Le partage proposé par Perplexity suit la complexité réelle de chaque opération, selon les explications données à Computex.
| Type de tâche | Lieu d’exécution | Raison principale |
|---|---|---|
| Résumé, mise en forme, classification | Sur le PC, en local | Calcul léger, latence réduite |
| Raisonnement en plusieurs étapes | Dans le cloud | Besoin des grands modèles |
| Recherche augmentée sur gros volumes | Dans le cloud | Puissance des serveurs |
| Document confidentiel | Local par défaut, cloud sur accord | Maîtrise des données |
Ce tableau éclaire la zone grise du système, car la frontière entre local et cloud n’est pas figée : elle se redessine à chaque requête. La même demande pourra rester chez vous un jour et partir le lendemain, au gré de la charge et du matériel. Cette plasticité prolonge la course à l’efficacité que les fermes de calcul tentent déjà de gagner autrement.
Qui paiera vraiment le calcul de demain
La vraie question soulevée par cet orchestrateur dépasse la prouesse technique. Elle porte sur la répartition de la charge entre le fournisseur d’énergie, l’éditeur d’IA et l’utilisateur final. Faire glisser une partie du calcul vers le poste de travail déplace silencieusement la frontière des responsabilités, et personne n’a encore tranché qui devra investir dans le matériel.
Pour Perplexity, l’enjeu touche aussi à sa propre trajectoire. L’entreprise évoque une entrée en Bourse et défend un modèle où elle s’améliore à mesure que progressent les IA qu’elle agrège. Son pari repose sur l’idée que l’avenir appartient à l’orchestration plus qu’à la puissance, un positionnement qui la distingue d’OpenAI ou de Google.
Les prochains mois diront si l’IA hybride tient ses promesses ou si elle se contente de redistribuer une facture toujours plus lourde. Le terrain de la compétition se déplace vers l’économie du watt et la maîtrise du lieu d’exécution, là où se dessine sans doute la prochaine hiérarchie des acteurs de l’IA.

