-
Les 11-14 ans passent presque 2 heures par jour sur les réseaux sociaux et messageries, selon Médiamétrie
-
Les 11-14 ans passent presque 2 heures par jour sur les réseaux sociaux et messageries (Médiamétrie)
-
JO-2026: Federica Brignone championne olympique du super-G, Romane Miradoli en argent
-
Virus Nipah: risque de propagation faible au niveau mondial, selon l’OMS
-
L'UE promet de se réformer pour résister à la Chine et à Trump
-
Corée du Nord: Kim s'apprêterait à désigner sa fille comme héritière, selon Séoul
-
Grèce: les Cyclades emportées par la fièvre du béton
-
Compétitivité: Macron et Merz s'affichent ensemble, malgré les divergences
-
Tempête Nils: les vents violents font un mort, 900.000 foyers privés d'électricité
-
Sanofi évince son directeur général Paul Hudson, remplacé par Belén Garijo
-
Luxe: le patron d'Hermès raconte comment Jeffrey Epstein a fait le forcing pour l'approcher
-
Le CAC 40 dépasse les 8.400 points pour la première fois
-
Incendie en Suisse: vive colère des proches de victimes à l'arrivée des Moretti à une audition
-
JO-2026: Lucas Pinheiro Braathen trace sa route entre les portes et hors-piste
-
Dans les pays montagneux d'Asie centrale, le ski alpin patine encore
-
Sanofi: le directeur général Paul Hudson prend la porte après de récents revers
-
Madagascar: le bilan du cyclone Gezani s'alourdit à 35 morts
-
Le Venezuela s'apprête à adopter une loi d'amnistie historique
-
Nucléaire, renouvelables: le gouvernement dévoile enfin sa stratégie énergétique d'ici 2035
-
Mondial-2026: le prix des billets explose sur le site de revente officiel
-
Condamnation de Jimmy Lai: les journalistes hongkongais sur le fil du rasoir
-
Hommage aux victimes de la tuerie dans une ville canadienne en deuil
-
Le président taïwanais avertit que la Chine ne "s'arrêtera pas" si elle s'empare de Taïwan
-
JO-2026: ces drones qui poursuivent les champions pour plus de spectacle
-
JO-2026: avant le super-G, Federica Brignone déjà géante
-
JO: Lucas Defayet, le Breton du skeleton qui rêvait du Stade rennais
-
Législatives au Bangladesh: les favoris battent le rappel de leurs partisans
-
NBA: Wembanyama enchaîne, les cadors se baladent à l'Est
-
La France sous les rafales de la tempête Nils, des rafales de plus de 160 km/h
-
Argentine: la dérégulation du travail voulue par Milei avance au Parlement, face à la colère sociale
-
Législatives au Bangladesh: les favoris exhortent la population à voter en masse
-
Après la tuerie au Canada, les enquêteurs s'interrogent sur le profil de l'assaillante de 18 ans
-
Au procès des réseaux sociaux, le patron d'Instagram se défend de nourrir l'addiction des jeunes
-
JO: La lueur d'espoir Miradoli, Cavet après Laffont sur les bosses
-
JO: Federica Brignone juste à temps, Chloé Kim pour un triplé historique
-
L'UE veut accélérer ses réformes économiques pour résister à la Chine et à Trump
-
Cinéma: la Berlinale ouvre pour examiner la complexité du monde
-
L'administration Trump va abroger le fondement des règlementations climatiques américaines
-
Ariane 6: compte à rebours pour un vol de toutes les premières pour Amazon
-
En visite au Venezuela, un ministre de Trump prône une hausse "spectaculaire" de la production de pétrole
-
Le Congrès américain inflige un revers à Trump sur ses droits de douane
-
Dans la troisième ville d'Argentine, la police toutes sirènes hurlantes pour ses salaires
-
Argentine: coktails Molotov contre balles en caoutchouc, heurts en Argentine autour de la réforme du travail
-
Angleterre: Manchester City met la pression, Liverpool se reprend
-
JO: Cizeron et Fournier Beaudry hypnotisent Milan et s'offrent l'or olympique
-
Un incendie ravage un camp de déplacés au Soudan, un mort et des blessés
-
Procès des réseaux sociaux: le patron d'Instagram rejette l'idée d'addiction
-
Wall Street en demi-teinte après l'emploi américain
-
Au Congrès américain, les démocrates accusent la ministre de la Justice d'"étouffer" le scandale Epstein
-
Mort de James Van Der Beek, héros de la série "Dawson", à 48 ans
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.
"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.
"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."
A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.
C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.
Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.
"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.
"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."
Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.
"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."
- Tromper les humains -
Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.
"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.
La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.
L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.
Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.
"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."
Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.
"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.
Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."
Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.
Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.
Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.
"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.
Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.
"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."
Y.Zaher--SF-PST