Le monde qui l'a façonné - Le paradoxe de Newcomb

À la fin des années 1960, la théorie de la décision était devenue l'un des moteurs discrets de la philosophie et de l'économie d'après-guerre. Elle promettait quelque chose à la fois technique et moralement chargé : un compte rendu formel de la manière dont un agent rationnel devrait choisir en situation d'incertitude. L'aspiration n'était pas simplement d'aider les gens à choisir des actions ou des jeux. Il s'agissait de dire ce que cela signifiait de bien délibérer lorsque les preuves, le risque et l'action étaient entremêlés.

Le cadre dominant était la théorie de l'utilité espérée, qui avait une lignée remontant à la théorie des jeux de von Neumann et Morgenstern et aux axiomes de décision statistique de Leonard Savage. Dans sa forme la plus large, le tableau semblait ordonné : identifier les résultats, assigner des probabilités, évaluer les utilités et choisir l'acte avec le meilleur résultat attendu. Mais ce tableau ordonné dissimulait une question plus profonde. Les probabilités en délibération doivent-elles toujours être comprises comme des croyances sur la manière dont le monde sera, ou parfois comme des signes que le monde a déjà été arrangé en réponse à ce que vous allez faire ?

Cette question avait déjà commencé à troubler les philosophes et les économistes dans des cas de prédiction, de préengagement et d'auto-référence. Si une action future est prédite, la prédiction compte-t-elle comme une preuve ou comme une cause ? Si le choix présent d'une personne est corrélé avec un événement antérieur, la rationalité doit-elle suivre le chemin causal par lequel l'argent arrive, ou l'association statistique entre un choix et une récompense ? La théorie de la décision avait le vocabulaire pour de tels casse-têtes, mais pas encore la scène emblématique sur laquelle ils seraient dramatisés.

La scène était une expérience de pensée proposée par le physicien William Newcomb en 1969, puis diffusée par le logicien mathématique Martin Gardner. Le dispositif de Newcomb est arrivé à un moment où les philosophes prenaient de plus en plus conscience que les modèles formels pouvaient produire des verdicts clairs uniquement en cachant des hypothèses contestées. Le paradoxe n'est pas né d'une découverte scientifique exotique. Il provenait d'un dispositif minimal : un prédicteur surhumain, un choix transparent, et une structure de récompense qui fait trébucher le bon sens.

L'atmosphère intellectuelle environnante était importante. L'idéal de choix rationnel d'après-guerre avait été renforcé par son succès en économie et affaibli par le soupçon que ses axiomes soignés pourraient ne pas capturer le raisonnement humain dans tous les cas. En même temps, les philosophes étaient plus disposés qu'auparavant à traiter la « rationalité » comme quelque chose qui pourrait se fracturer en normes rivales : ce qui maximise le gain attendu, ce qui correspond à vos preuves, ce qui respecte l'indépendance causale, et ce qui survit à la réflexion dans des conditions idéales. Le cas de Newcomb forcerait ces normes à entrer en collision.

Le problème qu'il cherchait à exposer n'était pas simplement la cupidité contre la prudence. C'était un conflit plus exigeant entre deux façons de lire une situation décisionnelle. D'un côté se tenait une image de l'action comme intervention : vous faites ce que vous pouvez maintenant, et seules les conséquences causales de cet acte comptent. De l'autre, se tenait une image de l'action comme preuve : votre choix révèle quelque chose sur le type d'agent que vous êtes, ou sur la manière dont le monde a déjà été organisé autour de votre décision. Le paradoxe de Newcomb ferait en sorte que chaque côté semble convaincant et incomplet.

La puissance du dispositif provenait de son austérité. Il n'y a pas de motifs cachés, pas de pressions sociales, pas de chronologies compliquées pour distraire le lecteur. On ne voit que la mécanique du choix rationnel réduite à l'essentiel. Une personne est placée devant deux boîtes. La première contient une somme visible, généralement mille dollars. La seconde contient soit rien, soit une somme beaucoup plus importante, généralement un million de dollars, mais son contenu avait été fixé plus tôt par un prédicteur qui avait essayé de prévoir le choix de l'agent. Si le prédicteur prévoyait que l'agent ne prendrait que la boîte opaque, elle était remplie ; si le prédicteur prévoyait les deux boîtes, elle restait vide.

Le paradoxe entre ici, non pas comme une floraison rhétorique mais comme un choc structurel. La prudence ordinaire dit de prendre les deux boîtes : l'argent visible est déjà là, et le prendre ne peut pas rendre la boîte cachée plus vide, car la prédiction est dans le passé. Pourtant, l'expérience ordinaire avec des prévisionnistes très fiables dit qu'une personne qui choisit une seule boîte fait généralement beaucoup mieux. Le casse-tête n'est pas que l'une des réponses semble égoïste et l'autre noble. C'est que chacune semble satisfaire un idéal central de rationalité tout en violant un autre.

L'expérience de pensée tirait également sa force d'une source inattendue : sa dépendance presque théâtrale à un prédicteur idéal. Le prédicteur n'a pas besoin d'être logiquement omniscient, seulement extrêmement précis. Ce détail est crucial, car il rend le cas moins métaphysique et plus semblable à une version aiguisée de la vie réelle, où les employeurs, les médecins, les algorithmes et les États font tous des prévisions faillibles mais guidées par le comportement. Le paradoxe de Newcomb ne posait pas simplement un casse-tête sur un jeu fictif. Il laissait entendre que de nombreuses institutions ordinaires échangent déjà des formes de prédiction que la théorie du choix rationnel n'avait pas encore pleinement apprivoisées.

Et donc, avant qu'une doctrine formelle ne soit annoncée, une division était déjà visible. Certains penseurs entendaient le casse-tête comme un test de causalité : sûrement mon acte présent ne peut pas modifier l'argent déjà dans les boîtes. D'autres l'entendaient comme un test de preuve : sûrement un choix qui corrèle de manière fiable avec le fait d'être le genre de personne qui obtient le million ne doit pas être écarté comme s'il était causalement inerte. La question suivante, alors, était de savoir si la meilleure réponse au jeu pouvait être énoncée simplement, ou si le paradoxe forcerait la théorie de la décision à se diviser à la racine.