La fin de l'IA à 20 €/mois : pourquoi le forfait illimité s'effondre (et ce que ça change pour votre PME)

Pendant deux ans, l'idée que « l'IA coûte 20 euros par mois » s'est installée dans l'esprit des dirigeants. ChatGPT à 20 € par utilisateur, Copilot à 19 €, Claude à 18 € — toute une économie de l'IA s'est construite sur un modèle d'abonnement à prix fixe, copié-collé du SaaS classique. Ce modèle vient de craquer, publiquement, en quelques semaines.
Le 27 avril 2026, GitHub a annoncé que Copilot basculait en facturation à l'usage à partir du 1er juin. Quelques jours plus tard, Microsoft a confirmé l'annulation de ses licences Claude Code internes au 30 juin pour la division Experiences & Devices — budget annuel cramé en quelques mois. Uber a publiquement reconnu avoir brûlé l'intégralité de son budget IA 2026 en quatre mois.
Ces trois faits, isolés, ressemblent à des accidents. Pris ensemble, ils racontent une histoire différente : le modèle d'abonnement IA à prix fixe est en train de mourir, et ce n'est ni un accident de parcours ni un problème conjoncturel. Cet article explique pourquoi, ce que ça change concrètement pour votre PME, et les trois décisions à prendre dans les mois qui viennent.
Le mental model qui se casse : « ChatGPT coûte 20 euros par mois, donc l'IA c'est pas cher »
Le succès de ChatGPT grand public a installé un raisonnement implicite dans la tête de beaucoup de dirigeants : si je paie 20 € par mois pour une IA qui répond à tout, alors équiper 100 collaborateurs coûtera 2 000 € par mois. Le calcul est simple, le budget est lisible, la décision est facile.
Ce raisonnement est devenu le mental model par défaut. Il est ancré, parce qu'il vient d'une expérience utilisateur réelle : vous, dirigeant, payez vos 20 € chaque mois et vous obtenez ce dont vous avez besoin. Vous extrapolez à votre entreprise.
Le problème, c'est que ce raisonnement repose sur une hypothèse qu'on ne questionne jamais : que le coût marginal d'un utilisateur supplémentaire est nul ou marginal pour l'éditeur. C'est vrai pour un logiciel SaaS classique — ajouter un utilisateur à votre CRM ne coûte pratiquement rien en infrastructure. Ce n'est pas vrai pour l'IA générative. Chaque requête envoyée à un modèle consomme des cartes graphiques, du temps de calcul, de l'énergie. Multiplier les utilisateurs ou les usages multiplie strictement les coûts pour l'éditeur. Pendant deux ans, ces éditeurs ont absorbé la différence, financés par les levées de fonds. Cette période se termine.
Ce qui s'est vraiment passé en mai-juin 2026 : GitHub, Microsoft, Uber
GitHub Copilot est l'outil de codage assisté par IA le plus utilisé au monde, avec environ 20 millions de sièges entreprise payants. Le 27 avril 2026, Mario Rodriguez, directeur produit de GitHub, a publié un billet de blog officiel annonçant le basculement vers la facturation à l'usage au 1er juin. Sa justification, sans détour : « Copilot est passé d'un assistant dans l'éditeur à une plateforme agentique capable de faire tourner des sessions de code longues et multi-étapes, et l'usage agentique amène des demandes de calcul et d'inférence significativement plus élevées. » Les tarifs des forfaits ne changent pas, mais chaque forfait inclura désormais un montant équivalent en crédits mensuels. Une fois ces crédits épuisés, l'usage s'arrête, sauf si l'entreprise autorise des dépenses supplémentaires.
Microsoft, dans le même mouvement, vient d'annuler ses licences Claude Code internes pour la division Experiences & Devices au 30 juin 2026. Le budget IA annuel de cette division a été consommé en quelques mois. Quand l'entreprise qui finance OpenAI et qui héberge la moitié de l'infrastructure IA mondiale n'arrive pas à absorber les coûts d'usage interne de ses propres ingénieurs, ce n'est pas un signal anecdotique.
Uber, enfin, est le cas le mieux documenté. Nikita Shamgunov, directeur technique, a expliqué publiquement que l'entreprise a brûlé l'intégralité de son budget IA 2026 en quatre mois — principalement via des outils de codage IA. Les ingénieurs rapportent des coûts compris entre 500 et 2 000 dollars par personne et par mois. Le taux d'utilisation est passé de 32 % à 63 % des ingénieurs en deux mois. Aujourd'hui, 95 % des ingénieurs Uber utilisent l'IA chaque mois, et 11 % du code de production est écrit par des agents. L'entreprise est, selon les mots de son directeur technique, « de retour à la planche à dessin » sur sa budgétisation IA.
Ces trois exemples ne sont pas des accidents. Ils racontent la même histoire : quand l'IA passe d'un assistant ponctuel à un outil opéré en continu, le coût pour l'éditeur explose, et le modèle d'abonnement à prix fixe ne tient plus.
Pourquoi les coûts d'IA n'ont pas d'économies d'échelle (et pourquoi c'est durable)
Pour comprendre la suite, il faut accepter une réalité économique contre-intuitive : l'IA générative n'a pas d'économies d'échelle classiques. Un grand modèle de langage (LLM, pour Large Language Model) répond à chaque question en consommant de la puissance de calcul proportionnelle à la longueur de la question et de la réponse. Mille utilisateurs qui posent dix questions chacun consomment littéralement dix fois plus de calcul que cent utilisateurs qui posent les mêmes dix questions. Aucune mutualisation possible côté calcul.
Cette différence n'est pas anodine. Un SaaS classique — votre CRM, votre outil RH, votre plateforme e-commerce — fonctionne sur l'inverse : l'infrastructure coûte cher à construire et presque rien à exploiter pour chaque utilisateur supplémentaire. C'est ce qui permet les abonnements à prix fixe. Pour un éditeur d'IA générative, ajouter un client double presque mécaniquement la facture de calcul.
L'industrie travaille évidemment sur les optimisations : distillation de modèles (rendre les modèles plus petits sans perdre en performance), quantization (calculer en moins de précision), cache sémantique (réutiliser les réponses similaires), mélange d'experts (n'activer qu'une partie du modèle selon la question). Ces techniques font baisser le coût par requête, et c'est réel. Mais elles le font dans un contexte où l'usage explose plus vite que le coût unitaire ne baisse. Une PME qui utilisait l'IA trente fois par mois en 2024 l'utilise trois cents fois par mois en 2026. La facture totale monte, même si le prix par requête baisse.
C'est ce point structurel qui rend la situation durable. Les éditeurs ne vont pas, dans six mois, retrouver les marges d'un SaaS classique en optimisant un peu plus. La structure de coût est différente, point. Tous, à terme, basculeront vers une forme de facturation à l'usage. Pour les PME, cela veut dire qu'il faut maintenant raisonner en coût par usage, pas en coût par utilisateur.
AI-forward vs AI-native : la vraie question budgétaire pour votre PME
Ce qui distingue les entreprises qui dérapent (Uber, Microsoft Experiences & Devices) de celles qui maîtrisent leur budget IA n'est pas tant le volume d'usage que la nature du déploiement. Le consultant Sébastien Tandel a popularisé une distinction utile : AI-forward vs AI-native.
Une organisation AI-forward greffe l'IA sur une architecture conçue par et pour des humains. On déploie ChatGPT, Copilot, un assistant de réunion, un outil de prompt engineering, un peu de RAG (Retrieval-Augmented Generation, IA branchée sur vos documents internes) — sans toucher aux processus eux-mêmes. Les coûts d'IA s'AJOUTENT aux coûts existants : salaires, logiciels métiers, infrastructure. C'est rapide à déployer, c'est rassurant, et c'est ce que font la plupart des entreprises aujourd'hui. C'est aussi ce que faisait Uber, Microsoft Experiences & Devices, et tous ceux qui ont vu leur facture déraper.
Une organisation AI-native, à l'inverse, repense un processus pour qu'il soit opéré par des agents IA, avec des humains qui supervisent. Les coûts d'IA REMPLACENT des coûts humains et logiciels existants. Ce n'est pas plus cher en absolu — c'est même souvent moins cher — mais c'est radicalement différent à mettre en œuvre.
Pour une PME, la question budgétaire n'est donc pas « combien va me coûter l'IA ? » mais « qu'est-ce que l'IA va remplacer dans mon organisation ? » Sans cette grille de lecture, on accumule sans rationaliser : un abonnement par-ci, un outil par-là, et au bout de six mois, on n'a plus de vision globale du budget ni du retour sur investissement. C'est exactement le scénario Uber, à une autre échelle.
Si vous vous demandez où en est votre PME sur cette grille, c'est précisément le travail d'un diagnostic IA stratégique : repérer les processus qui peuvent passer en AI-native, ceux qui resteront AI-forward, et construire une feuille de route budgétaire cohérente avec les deux logiques.
Trois décisions à prendre cette année dans votre PME
Décision 1 : faire l'audit d'usage IA actuel. Avant tout, vous devez savoir ce qui se passe déjà chez vous. Combien de collaborateurs utilisent un outil IA payé sur leur carte personnelle ? Combien d'abonnements professionnels sont actifs et pour quel usage réel ? Quel est le ratio utilisateurs déclarés / utilisateurs actifs ? Le « shadow IT IA » — les usages individuels non audités — est devenu une catégorie de budget invisible dans la plupart des PME. Avant d'arbitrer, il faut voir. Cet audit est typiquement la première brique d'une démarche structurée et fait l'objet d'un article dédié dans notre guide des budgets IA pour PME en 2026.
Décision 2 : privilégier les contrats d'entreprise plutôt que les abonnements individuels. Si vos collaborateurs utilisent l'IA, mieux vaut le savoir et le cadrer. Les contrats d'entreprise (Copilot Business, ChatGPT Enterprise, Claude for Work, Mistral Enterprise) coûtent légèrement plus cher par utilisateur que les abonnements individuels, mais ils apportent trois garanties qui n'existent pas dans les versions gratuites ou personnelles : vos données ne sont pas utilisées pour entraîner les modèles, l'administration centralisée vous permet de contrôler les accès, et vous avez un interlocuteur contractuel en cas de problème. La règle est simple : si c'est gratuit, vos données alimentent le produit et la réponse est volontairement bridée. Les outils gratuits sont parfaits pour explorer et tester ; ils n'ont pas leur place dans un usage professionnel structuré.
Décision 3 : identifier un ou deux processus à rendre AI-native plutôt que d'empiler des outils AI-forward partout. Plutôt que de saupoudrer l'IA sur tous vos processus, choisissez un ou deux processus stratégiques (gestion des devis, support client, qualification de leads, comptabilité analytique, recrutement) et repensez-les pour qu'ils soient opérés par des agents. C'est plus exigeant à concevoir, mais le retour sur investissement est radicalement supérieur, parce que l'IA remplace au lieu de s'ajouter. C'est l'approche que nous appliquons en hIAppy Lab avec des sprints de 5 à 15 jours pour valider un cas d'usage avant d'investir.
Pourquoi un diagnostic externe vaut le coup à ce moment précis
Vous êtes dirigeant d'une PME ou d'une ETI, vous voyez passer ces nouvelles, vous sentez que quelque chose change, mais vous n'avez objectivement pas le temps de creuser le sujet vous-même. C'est exactement le moment où un diagnostic externe a le plus de valeur : vous bénéficiez d'une grille de lecture éprouvée, d'un audit budgétaire de l'existant, et d'une feuille de route concrète sur trois à six mois — sans avoir à monter en compétence vous-même sur les coûts d'inférence, le routage de modèles ou les architectures d'agents.
Un diagnostic hIAppy Vision dure quatre à six semaines. Il commence par un audit de votre usage IA actuel (Décision 1), pose la grille AI-forward / AI-native sur vos processus, et identifie deux à trois priorités budgétaires actionnables. C'est exactement le travail que les équipes Uber et Microsoft sont en train de refaire après coup, sous pression budgétaire. Le faire avant que la facture ne dérape est radicalement moins coûteux.
Pour les PME et ETI implantées dans le Nord et les Hauts-de-France, nous proposons un diagnostic IA à Lille en présentiel ou à distance, adapté à votre maturité et à votre secteur. Et si vous voulez prolonger cette réflexion budgétaire, l'article 5 pièges qui font exploser les budgets IA dans les PME détaille les mécaniques de dérapage avec leurs parades concrètes.
Conclusion : la fin de l'IA à 20 euros par mois n'est pas une mauvaise nouvelle
Ce qui se termine en mai-juin 2026, ce n'est pas l'IA accessible aux PME. C'est l'illusion que l'IA d'entreprise coûte le même prix que l'IA grand public. La période où les éditeurs absorbaient l'écart, financés par les levées de fonds, se termine — et c'est même plutôt une bonne nouvelle pour le marché, parce qu'elle force les acheteurs à raisonner en valeur créée et plus en coût d'abonnement.
L'erreur, à ce moment précis, serait de ne rien faire. De continuer à empiler des abonnements en pensant que la facture restera maîtrisée. Les exemples de Microsoft, Uber et de la bascule de GitHub Copilot montrent que ce n'est pas le cas. Si vous voulez mettre votre PME en position de force pour les douze prochains mois sur le sujet IA, le meilleur moment pour faire le point, c'était il y a six mois. Le deuxième meilleur moment, c'est maintenant. Parlons-en autour d'un diagnostic IA.
Tags
Partager cet article
Pierre Lefebvre
Fondateur de hIAppy, expert en intelligence artificielle et transformation digitale des entreprises.