-
Trump a gagné environ 1,2 milliard de dollars dans les cryptomonnaies en 2025
-
Washington réautorise l'IA de pointe d'Anthropic, actant sa reprise en main du secteur
-
Les océans mondiaux ont atteint un pic de chaleur en juin
-
Les rescapés du double séisme au Venezuela s'en remettent à la solidarité
-
A Washington, la "grande foire" de Trump pour les 250 ans des Etats-Unis divise
-
Séismes au Venezuela: espoirs et douche froide sous les décombres
-
Budget des Armées : le Parlement appelé à valider un nouvel effort à 36 milliards
-
Mondial-2026: Mbappé sublime les Bleus, parés pour les 8es, la Norvège défiera le Brésil
-
Mondial-2026: démonstration des Bleus, en route pour les 8e
-
Détournement de fonds de l'UE: série de perquisitions dans une enquête ciblant notamment le RN
-
Tennis: à 44 ans, la légende Serena Williams rate ses retrouvailles avec Wimbledon
-
Tennis: Serena Williams battue au 1er tour de Wimbledon pour son retour en simple à 44 ans
-
Le Mercosur affiche ses divergences après l'accord commercial conclu avec l'UE
-
Wall Street: le Nasdaq conclut son meilleur trimestre depuis le Covid-19, à +21%
-
Des milliers de Sud-Africains défilent pour exiger le départ des sans-papiers
-
"Pire qu'en Inde": à Rome, les touristes face au supplice de la canicule
-
Mondial-2026: la Norvège prend rendez-vous avec le Brésil, la France en salle d'attente
-
Merkel dévoile son portrait officiel pour le siège de la chancellerie à Berlin
-
Mondial-2026: Halaand et la Norvège punissent la Côte d'Ivoire sur le tard
-
La Bourse de Paris termine sur une note optimiste
-
Wall Street ouvre en hausse pour clôturer un trimestre fructueux
-
A Taïwan, les cueilleuses d'algues attendent en vain la relève
-
NBA: pas de retraite pour "le King" LeBron James mais d'autres cieux
-
Le directeur de la CIA compare l'IA de pointe à des "armes nucléaires numériques"
-
Wimbledon: débuts compliqués pour Swiatek et Rybakina, jour J pour Serena Williams
-
Ouverture du sommet du Mercosur, marquée par de vives critiques sur l'application de l'accord avec l'UE
-
La France vers un nouvel épisode de fortes chaleurs après une canicule exceptionnelle
-
Fin de vie: troisième vote positif à l'Assemblée, avant l'épilogue
-
Enfance: un projet de loi à l'Assemblée, bientôt élargi après l'affaire Lyhanna
-
La Cour suprême américaine sanctuarise le droit du sol, un revers majeur pour Trump
-
L'affichage de l'origine des viandes sur les produits transformés validé par les sénateurs
-
Basket: LeBron James va poursuivre sa carrière en NBA mais quitte les Lakers (médias)
-
Google va lancer ses résumés par IA en France, nuage noir en vue pour les médias
-
Les Bourses mondiales terminent le trimestre optimistes
-
La Cour suprême américaine préserve le droit du sol, un revers majeur pour Trump
-
Les Emirats découvrent le voyage en train, encore rare dans le Golfe
-
Foot: Gonçalo Ramos quitte le PSG pour l'AC Milan
-
Wimbledon: débuts compliqués pour Swiatek, jour J pour Serena Williams
-
Microsoft publie pour la première fois le détail de ses revenus et impôts dans l'UE
-
La Cour suprême préserve le droit du sol, revers majeur pour Trump
-
Canicule: la France vers un nouvel épisode de fortes chaleurs après une canicule exceptionnelle
-
Pas de revalorisation des allocations chômage au 1er juillet, une première en dix ans
-
Les Bourses mondiales dans le vert au dernier jour d'un trimestre prolifique
-
Mondial-2026: la France favorite prudente, la Norvège décomplexée et un Mexique qui rêve
-
Fatigué d'être seul? Ce robot chinois à corps d'humain vous tend la main
-
Fronde contre le projet gouvernemental de consigne des bouteilles en plastique
-
Sur les plages de Kiev en pleine vague de chaleur, oublier la guerre
-
Onze librairies Furet du Nord et Decitre doivent fermer, jusqu'à 163 postes touchés
-
Au Mondial, des stars sur le terrain et en tribunes
-
Nombre record de "nouveaux millionnaires" dans le monde en 2025, selon UBS
Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts
L'émergence des agents d'intelligence artificielle (IA) a fait exploser la facture IA de bon nombre d'entreprises, qui se tournent vers des modèles moins coûteux pour ne pas rogner sur leur consommation.
Finie, l'ère de "l'intelligence subventionnée" - selon l'expression de Kevin Simback, de l'incubateur Delphi Labs - née avec ChatGPT et la déferlante de l'IA générative.
Pour favoriser l'adoption de cette nouvelle technologie, les grands acteurs du secteur, OpenAI en tête, ont proposé initialement des tarifs très attractifs, au point que leur activité était déficitaire.
"Mais le vent est en train de tourner", prévient Kevin Simback.
Chacun à leur tour, les poids lourds de l'IA ont récemment revu leurs prix pour les ajuster à l'utilisation réelle des capacités informatiques nécessaires pour faire tourner les modèles.
L'avènement des agents IA, des programmes capables d'effectuer des tâches et plus seulement de donner des réponses, a, en outre, fait bondir le recours aux infrastructures informatiques.
Pour une même mission, l'interface peut se démultiplier en plusieurs agents, chacun avec sa feuille de route, le tout assemblé et vérifié par d'autres agents.
A l'arrivée, le nombre de "tokens", unité de référence pour mesurer le résultat produit par l'IA, peut représenter des dizaines de fois celui correspondant à une simple question à ChatGPT.
Le tout s'inscrit dans une période de déséquilibre. Les centres de données et les fabricants de puces ne parviennent pas à suivre le rythme effréné de la demande d'intelligence artificielle, ce qui renchérit l'accès aux infrastructures.
"En particulier chez les développeurs, le coût d'utilisation de l'IA pour la programmation s'est accru de façon exponentielle", observe Mark Barton, de la société d'accompagnement numérique Omniux.
Par extension, pour tous les modèles de référence du marché, "les prix commencent à s'envoler", insiste-t-il.
Face à ce nouveau paradigme, certains questionnent le déploiement à tout crin de l'IA, tels l'enseigne de grande distribution Target, Starbucks ou Uber.
"Dans certains cas, le coût dépasse celui d'un employé au bout d'un mois ou deux parce qu'ils l'utilisent trop", décrit Jack Gold, président du cabinet J.Gold Associates.
- Pas d'IA "sans raison" -
Pourtant sacré, en début d'année, champion du "tokenmaxxing", mouvement qui glorifie la dépense maximale de "tokens" comme mètre étalon de productivité des employés, Meta a récemment mis le hola.
"Personne ne devrait recourir à des outils IA sans raison", a ainsi écrit le responsable technologique du groupe, Andrew Bosworth, dans un mémo interne relayé par le Wall Street Journal.
Mais si le discernement est désormais de mise, la plupart des sociétés cherchent surtout à accéder à une IA moins onéreuse, en recourant à des modèles moins performants que les fleurons du secteur.
Dans ce contexte, la popularité des modèles dits "open weights", téléchargeables gratuitement, est croissante, leur usage ne nécessitant que l'achat de puissance de calcul.
Les entreprises se tournent aussi vers des modèles de plus petite taille, les SLM (small language models) en lieu et place des LLM, qui servent de base à ChatGPT, Claude ou Gemini.
Ces SLM peuvent parfois tourner sur les serveurs locaux ou même directement sur l'ordinateur, une option plus économique car elle évite de payer un fournisseur de capacité à distance (cloud).
Il est aussi possible de scinder une demande unique (prompt) en étapes distinctes pour les confier, à chaque fois, à l'interface adaptée, explique Adrian Balfour, du cabinet de conseil numérique Enverso.
"Quand vous passez par un grand modèle monolithique, vous en aurez à peu près pour 15 dollars le million de +tokens+ alors qu'en prenant des mini-modèles, vous ferez descendre le tout à 5 cents", assure-t-il.
Beaucoup voient dans cette refonte la première étape de la banalisation des modèles, devenus interchangeables sans déperdition.
Dès lors, ce sont les plateformes de sélection et de coordination des modèles et des agents qui prennent de l'importance, selon John Belton, gérant au sein de la société d'investissement Gabelli Funds.
Sur ce créneau, des start-up se battent avec des mastodontes du "cloud" comme Amazon, qui propose déjà de jongler avec une multitude d'IA via sa plateforme Bedrock, mais aussi les géniteurs de l'intelligence artificielle eux-mêmes.
Anthropic dispose ainsi d'une gamme complète de modèles, dont Haiku, l'option la plus économique, à l'instar d'OpenAI et de Google.
John Belton ne voit d'ailleurs pas ces étoiles de l'IA perdre des parts de marché à mesure que les clients cherchent l'efficacité plutôt que la performance.
"Les utilisateurs les plus avancés seront toujours prêts à payer" pour ce qui se fait de mieux, prévoit-il. "Le gâteau ne fait que grossir."
B.AbuZeid--SF-PST