IA : Le grand silence

Il n’y a pas si longtemps, le grand magazine de l’IA, Wired, pouvait titrer The End of Theory: The Data Deluge Makes the Scientific Method Obsolete, sous la signature de Chris Anderson, son rédacteur en chef, sans que ça ne scandalise personne. Tout récemment, d’autres nous prédisaient la « mort de la mort » et voyaient dans ceux qui avaient de légers doutes sur les biens fondés de l’IA, les « chimpanzés du futur », ce qui n’est pas très gentil pour nos plus proches cousins.

Avec le coronavirus, la nature vient de nous administrer une magistrale leçon de modestie, car tout est partie d’un virus nouveau, probablement de nature animale, par des pangolins et/ou des chauves-souris, sur un marché de Wuhan, une ville chinoise bien connus des lecteurs de Hergé, car c’est là que Tintin, dans le Lotus bleu, rencontre et sauve de la noyade son jeune ami Zhang, dans le Yang Tse en crue.

A la vue de ce qui s’est passé en Chine et dans les pays voisins, le nombre de morts ne dépassera probablement pas le seuil d’une grosse grippe mondiale. Par contre la facture humaine et économique comme solde de notre aveuglement et de notre inconséquence va être particulièrement salée, car en quatre mois c’est toute la planète économico-financière qui est passée en Stand by. Après les fanfaronnades déplacées du Président D. Trump, et du PM britannique B. Johnson, tout le monde se confine, une méthode basique de survie face à l’inconnu dont l’Europe et l’Occident avaient perdu le mode d’emploi.

Et l’IA dans tout ça ?

L’IA est doublement inopérante car face à un phénomène nouveau, par définition, il n’y a pas de données disponibles. On peut donc fouiller toutes les bases de données que l’on veut, on ne trouvera rien, sauf peut-être des corrélations fallacieuses si on abdique son bon sens, ce qui conduirait mécaniquement à des décisions absurdes. Le fait que tous les algorithmes de reconnaissance ne fonctionnent que par imitation – d’où la nécessité des très grandes bases de données –, les rend inopérants puisque par définition, face à l’inconnu, il n’y a rien à reconnaître. On peut toutefois se demander pourquoi ces algorithmes jugés si « intelligents » par ceux qui n’en ont jamais écrit un seul, n’ont pas été capables de détecter la fragilité du système économique. Car cette fois, tout au contraire, les données étaient parfaitement connues. Lorsque l’on dérégule un système, on sait qu’on le fragilise, et il y a même des théorèmes qui le démontrent ; mais c’est malheureusement ce qui a été fait, amplifié par des systèmes mathématiquement absurdes comme les transactions financières hautes fréquences.

L’intelligence humaine est mise au défi par les plus petits organismes que la vie ait fabriqué tout au long de son histoire, vieille de plus de deux milliards d’années. Les virus de la grippe, de petits brins d’ADN/ARN, ont été séquencés et on sait que leur taille, dans l’alphabet génétique à quatre lettres ATCG, est d’environ 13.000 lettres, soit cinq pages de texte. Pour ce qui nous concerne la base de données des génomes dit 3.095.677.412, soit 238.130 fois plus long. Quant à notre différence avec nos cousins chimpanzés, les 1,23% de différence représentent quand même, en valeur absolue, 41,82 millions de lettres de différence, c’est-à-dire 3.220 fois le génome de la grippe. Il faut se méfier des %, et encore plus de la combinatoire. Le génome du Covid-19 a été séquencé par nos amis Chinois en un temps record qu’il faut saluer, à peine 2 mois ; mais c’est une procédure mécanique qui ne dit pas comment ça marche. La combinatoire à explorer est de 413.000soit en ordre de grandeur 107.827, à comparer à celle du jeu de Go [10170] présentée par certains comme un étalon de mesure de l’« intelligence ». Sauf qu’ici on ne connaît pas les règles du jeu de ce virus. Pour essayer de comparer, il faut l’équivalent d’une échelle de Richter utilisée dans les tremblements de terre, ce qui dans ce cas nous donnerait 46, c’est-à-dire 7.827¸170.

On vient de découvrir que certains patients infectés subissent des pertes de goût, d’autres ont le cerveau atteint, etc. C’est une observation, pas une prédiction théorique. Le séquençage ne prédit rien du tout ! Ce n’est pas son rôle.

Si l’on reprend nos différences avec les chimpanzés, la combinatoire est cette fois colossale : 441.820.000, quelque chose comme 1025.000.000, soit en échelle Richter pas loin de 150.000. On finira peut-être par comprendre, mais il nous faudra compter en siècles ! Car dans l’échelle de Richter, c’est l’exposant qui varie ; dire que quelque chose va coûter 100, une complexité 46 fois plus grande sur l’échelle de Richter va coûter 10046 fois la référence, car la croissance en coût est exponentielle. Même en optimisant, cela nécessitera une énergie colossale.

Le philosophe Peter Sloterdijk dans son recueil Réflexes primitifs, 2019, nous dit, dans son style pas vraiment diplomatique : « S’il fallait caractériser d’une seule phrase l’atmosphère mentale du début du XXIe siècle, en Occident comme dans le ‘reste du monde’ ce serait forcément : l’imposture est devenue l’esprit du monde ». La leçon du Covid-19 nous ramène à notre juste mesure. C’est une preuve existentielle, par l’absurde pourrait-on dire, que les imposteurs ont pris le pouvoir, ou presque, bien secondés, et c’est assez triste à dire, par des médias d’une rare complaisance, quant aux réseaux sociaux drogués à l’IA c’est plutôt Satanas ex machina.

Face à l’imprévisible, le risque de la science fictive

La crise du Covid-19 nous donne un bon exemple de ce qu’est une science fictive, c’est-à-dire une science fantasmée qui ne repose sur rien, en écoutant simplement ce que disent nos meilleurs virologues, immunologues, etc. Ils ne comprennent pas les modes d’actions du Covid-19. Mais ceux qui prétendent en savoir suffisamment sur notre propre génome, beaucoup plus complexe, sont dans la science fictive ; ce sont au sens propre des apprentis sorciers. Nous vivons dans un monde incertain, un monde complexe qui évolue en permanence et qui s’adapte, où il y a toujours du nouveau, et ce à toutes les échelles où nous pouvons l’observer. Cependant, nous avons une tendance naturelle à croire que « il n’y a rien de nouveau sous le soleil » ; nous oublions les catastrophes qui jalonnent l’histoire humaine. En période d’accalmie, la démesure humaine, l’hubris, tend à nous faire croire que nous sommes redevenus l’égal des dieux, sans même se poser la question « serons-nous à la hauteur ? » comme disait Nietzsche.

L’IA médiatique présentée par certains n’est qu’une vaste imposture, mais il ne faudrait pas non plus tomber dans le délire inverse comme celui des collapsologues. Les ingénieurs savent faire des systèmes d’une grande complexité quoique non comparable avec celle du vivant, grâce à une ingénierie qui sait faire la part des choses entre les mathématiques, indispensables, l’expérimentation y compris la simulation numérique avec de vraies données, et le bon sens. L’une des machines les plus performantes, comme la NVIDIA, utilisées, entre autre en génomique, dispose d’une puce de 815 mm2, soit un petit carré de silicium de 3 cm de côté, qui intègre 21 milliards de composants nanométriques, en technologie à 12 nanomètres soit 3 fois la taille du pas de l’hélice de l’ADN de nos chromosomes ; 1 mm2 en contient environ 25 millions. Les méthodes utilisées pour les concevoir, les réaliser et les maintenir, garantissent que ce système est stable et qu’il peut être utilisé en toute confiance par ses programmeurs. C’est de ces méthodes dont il faut s’inspirer pour aménager notre « maison commune », et se méfier des imposteurs et/ou experts autoproclamés qui malheureusement pullulent et spéculent sur la crédulité, l’absence de bon sens, de nos concitoyens complètement déboussolés par des messages contradictoires sur fond de sciences fictives.

Les signaux faibles

Les crises sont des situations évolutives emblématiques caractérisées par des signaux faibles qui, à cause de la nouveauté, passent sous les radars des moyens d’observations issus de notre expérience du passé. Par définition ils échappent à l’analyse statistique fondée sur le calcul des probabilités et la loi des grands nombres. En ce sens, ils sont un magnifique exemple de science fictive mise en œuvre par les algorithmes statistiques dont le Big Data et l’IA font fréquemment usage. Fictive en ce sens qu’elle a toutes les apparences du sérieux que peuvent lui conférer des mathématiques plutôt haut de gamme, également en usage dans le monde de la finance, sauf que dans ce cas particulier elles sont illégitimes.

L’émergence d’un nouveau virus dans la famille SARS, comme le Covid-19, ne relève pas du hasard au sens probabiliste du terme mais de l’aléatoire dans des espaces de possibilités qui fabriquent des nombres « immenses » selon la terminologie de Borel mentionnée ci-dessus. La situation n’est pas comparable à celles appréhendées par la physique statistique, comme la fission des atomes 235U dans un réacteur nucléaire. On ne sait pas si tel atome précis va fissionner car le phénomène est aléatoire. Par contre, comme ils sont en très grand nombre – cf. le nombre d’Avogadro 6,02…´1023, pour 235 grammes d’uranium, soit un volume d’environ 10cl compte tenu de sa densité – le nombre moyen de fissions va suivre la loi des grands nombres, d’où une régularité et un déterminisme qui vont permettre le développement d’une ingénierie nucléaire. Confondre le hasard et l’aléatoire conduit tout droit à un usage illégitime du calcul des probabilités.

En physique statistique des particules comme les protons ou les électrons ont une individualité propre ; elles sont aussi vieilles que l’univers et elles peuvent se composer en gardant leur individualité, à l’inverse de particules comme les photons qui naissent et meurent en permanence. Protons et électrons ne gardent pas la trace de leur « vie » passée, ils sont égal à eux-mêmes quels que soient les assemblages dont ils ont été partie prenante. Le passé n’influe pas sur l’avenir.

Tel n’est pas le cas des virus qui une fois créés vont pouvoir se répliquer et se diffuser massivement grâce aux mécanismes biochimiques qu’ils vont parasiter dans les cellules qu’ils ont infestées. Ils vont interagir avec le génome de leur hôte, activer la synthèse de protéines pas forcément sympathiques, et provoquer des réactions du système immunitaire qui va mémoriser quoi faire en cas d’une nouvelle attaque virale. Tous ces mécanismes font que les événements dont l’organisme est le siège deviennent interdépendants – c’est un des aspects de la complexité du vivant – ce qui rend une nouvelle fois le calcul des probabilités inapplicables, car la métaphore de l’urne n’est plus pertinente. Dans les organismes vivants hautement organisés, la mémoire et l’histoire sont partout, d’où l’importance de la traçabilité des interactions pour comprendre ce qui se passe, mais pour vivre il faut d’abord survivre aux aléas inhérents à la vie.

Ceci est tellement vrai que les biologistes ont fabriqués des souris et des rats transgéniques, avec des génomes les plus identiques possibles, pour que dans les protocoles d’expérimentations ils puissent faire cette fois un usage légitime du calcul des probabilités ; la variété des situations a été réduite de façon à être le plus proche possible des conditions de l’urne. L’inconvénient est que les animaux ainsi formatés n’existent plus dans la nature, ils sont devenus vulnérables mais quand même représentatifs. Ce qui est possible avec des rats et des souris, ou avec des mouches drosophiles, ne l’est évidement pas pour les humains pour des raisons éthiques, d’où l’extrême complication des expérimentations sur l’homme, car compte tenu de la taille de notre génome et de la complexité des interactions biochimiques qui rythment notre vie, le renouvellement constant de toutes nos protéines et nos cellules, nous sommes tous à cette échelle, irrémédiablement, des êtres singuliers, y compris les vrais jumeaux. Nous pouvons parfaitement être le siège d’interactions qui ne se produiront que chez un individu particulier, ou un très petit groupe d’individus, d’où les maladie dites « orphelines » très difficiles à soigner du fait de leur rareté.

Toute cette combinatoire dont Borel avait jeté les bases ne peut pas être appréhendée par le calcul des probabilités, car l’espace des possibilités dépasse de très loin la taille de notre univers. Borel, pour familiariser ses lecteurs avec cette immensité avait inventé la métaphore des singes dactylographes en calculant la probabilité pour qu’une armée de singes tapant au hasard sur leurs machines à écrire finissent par produire une œuvre littéraire comme un roman de Balzac. L’âge de l’univers n’y suffirait pas, de très loin.

La complexité d’une puce comme celle de NVIDIA mentionnée ci-dessus ne s’appréhende pas de façon statistique mais par des méthodes constructives, comme celles mentionnées. Le hasard y est banni, mais pas l’aléatoire qui fait partie de son ingénierie.

Les enjeux de la rationalité

La science est certainement la plus grande conquête de la raison humaine. Mais la crise du Covid-19 montre oh ! combien cette conquête est fragile face aux déferlantes de l’irrationnel. N’a-t-on pas vu un homme politique, ancien ministre de la santé, proposer une pétition inepte pour statuer sur la chloroquine. C’est du Lyssenko, en pire ! Espérons que par un rebond salutaire, la tragédie du Covid-19 fera taire ceux qui n’ont rien à dire, et ramènera l’ambition de certains à de plus justes proportions, en nous rappelant que face aux forces de la nature nous ne sommes qu’un faible « roseau qui pense », c’est-à-dire aussi, par les temps qui courent, une planche de salut et non un risque, face à la déraison qui nous menace.

Par Jacques Printz, Professeur au CNAM, élu titulaire de la chaire de génie logiciel en 1994. Consultant auprès du ministère de la Défense, de Thales, EDF, RTE, créateur au CNAM du Centre de Maîtrise des Systèmes et du Logiciel (CMSL).

Cet article a été publié en partenariat avec l’Institut Fredrik R. Bull

Les opinions exprimées dans cet article sont celles de l’auteur et n’engagent pas Gouvernance.news

Share: