L'idée centrale - Le paradoxe de Newcomb

Le cœur du paradoxe de Newcomb réside dans une affirmation apparemment modeste : si un prédicteur est suffisamment fiable, alors le choix rationnel peut être de ne prendre que la boîte opaque, même si le mille visible est là, en pleine vue. Cette réponse semble trahir la maximisation ordinaire. Pourtant, le paradoxe est conçu de telle sorte que le choix qui semble inférieur à une inspection locale peut être celui qui s'adapte le mieux à la structure de la situation dans son ensemble.

La formulation classique se présente comme une petite fable de confiance et de prévoyance. On vous dit qu'un prédicteur presque parfait vous a déjà observé, vous a modélisé ou a d'une manière ou d'une autre compris votre comportement futur. Une boîte est transparente et contient déjà un montant garanti plus petit. L'autre est fermée et peut contenir une somme beaucoup plus grande. Le prédicteur a placé la somme plus importante dans la boîte fermée uniquement s'il prévoyait que vous prendriez la boîte fermée seule. S'il prévoyait que vous prendriez les deux, il a laissé la boîte fermée vide. Vous vous tenez maintenant devant les boîtes. Que devriez-vous faire ?

À première vue, prendre les deux semble irrésistible. Ce qui a été mis dans la boîte opaque a été déterminé avant votre choix, et donc, cette pensée va, votre action présente ne peut pas le modifier. Si la boîte est pleine, prendre également la plus petite somme visible vous donne plus d'argent ; si elle est vide, prendre les deux vous laisse tout de même avec le mille. De ce point de vue, choisir une seule boîte ressemble à de la superstition, comme si vous essayiez d'influencer le passé en souhaitant suffisamment fort.

Mais le cas a un autre visage. Un prédicteur très précis ne se contente pas de rapporter votre décision ; il crée un pont statistique entre votre choix présent et le contenu antérieur de la boîte. Si le prédicteur a presque toujours raison, alors l'acte de choisir une seule boîte est profondément associé à la présence du million à l'intérieur. En ce sens, votre choix est une preuve de ce que le monde était arrangé pour contenir. Un agent qui choisit une seule boîte est le type d'agent que le prédicteur s'attendait à trouver ; un agent qui choisit les deux est le type d'agent que le prédicteur s'attendait à trouver pauvre. L'énigme est que les deux descriptions sont vraies, et chacune pousse la rationalité dans une direction différente.

C'est ce qui a rendu le problème si troublant lorsqu'il a circulé pour la première fois. Ce n'était pas simplement un tour de casino. Il semblait opposer deux idéaux familiers l'un à l'autre. Un idéal dit : lorsque vous décidez, tenez compte uniquement des conséquences de votre acte. L'autre dit : lorsque vous décidez, tenez compte de ce que votre acte vous révèle sur le monde. Le paradoxe de Newcomb semble montrer que ces deux idéaux peuvent se séparer dans un cas brutalement simple.

La surprise est que le paradoxe n'est pas résolu en faisant appel à la faiblesse humaine. Même un agent idéalement rationnel y est confronté. La question n'est pas de savoir si certaines personnes sont plus impulsives que d'autres. Il s'agit de savoir si la rationalité elle-même devrait être indexée à l'impact causal ou à la corrélation probante. C'est pourquoi le cas a survécu si longtemps. Il n'exploite ni l'ignorance ni le biais ; il exploite un écart conceptuel dans le sens de « devrait ».

Le contexte historique a aiguisé le problème. Le défi a pénétré la discussion philosophique dans les années 1960 et est rapidement devenu un cas d'étude dans la théorie de la décision, surtout après que Robert Nozick l'a présenté par écrit dans Philosophical Explanations (1981), où la configuration de base a été attribuée au physicien William Newcomb. À partir de ce moment, l'énigme a acquis une forme canonique : un prédicteur si précis qu'il semble presque réduire la prévoyance à la certitude, et un joueur dont le choix semble n'avoir d'importance qu'après que le fait crucial a déjà été fixé. La question n'était pas un embellissement théâtral. C'était la structure propre, presque clinique, de l'exemple qui lui donnait sa force.

Une manière vivante de voir la tension est d'imaginer deux joueurs offerts les mêmes boîtes sous différentes fiabilités de prévision. Si le prédicteur est médiocre, choisir les deux peut être inoffensif ou même le meilleur choix, car la boîte cachée ne suit plus votre décision de près pour avoir de l'importance. Si le prédicteur est extraordinaire, le choix devient presque symbolique : prendre les deux est le signe du type d'agent qui finira généralement avec seulement le mille, tandis que prendre une seule boîte est le signe du type d'agent qui repart avec un million. Les enjeux pratiques sont évidents ; les enjeux philosophiques sont plus aigus. Quelle corrélation, le cas échéant, appartient à la logique du choix ?

La force plus profonde du paradoxe vient du fait que les deux réponses peuvent être formulées comme des applications de la rationalité plutôt que comme des départs de celle-ci. Si choisir une seule boîte rapporte de l'argent dans la configuration réelle, alors pourquoi le choix de deux boîtes n'est-il pas un échec de l'intelligence pratique ? Si choisir deux boîtes garantit le mille quoi qu'il arrive, alors pourquoi choisir une seule boîte n'est-il pas un échec de prudence ? Le cas est conçu de telle sorte que le langage ordinaire de la bonne prise de décision se fragmente.

Une seconde illustration aide. Considérez un médecin avec un modèle diagnostique presque parfait qui peut prédire si un patient développera une maladie. La prédiction ne cause pas la maladie, mais elle peut fortement y corréler. Dans la vie ordinaire, nous sommes déjà à l'aise pour traiter de telles corrélations comme des preuves. Le paradoxe de Newcomb demande pourquoi la théorie de la décision devrait se comporter différemment lorsque la corrélation ne concerne pas une maladie mais l'acte de quelqu'un et son gain.

Les enjeux deviennent plus clairs lorsque l'on se rappelle que l'énigme est construite autour d'une contingence cachée. Le grand gain n'est pas simplement « là » dans l'abstrait ; il n'est là que si le modèle antérieur du prédicteur sur vous s'est aligné avec l'acte que vous accompliriez plus tard. Si le prédicteur avait raison, le million a été placé dans la boîte opaque au préalable. Si le prédicteur avait tort, la boîte opaque a été laissée vide. Cela signifie que ce qui est dissimulé n'est pas seulement de l'argent, mais un enregistrement d'un jugement antérieur sur votre futur soi. L'argent, la prédiction et votre choix présent forment un système unique. La boîte sur la table est le point final visible d'une inférence antérieure.

Cette structure est ce qui donne au scénario sa précision documentaire. La boîte opaque n'est pas un objet mystique. C'est un artefact d'un raisonnement antérieur, un résultat d'une classification antérieure : un agent qui choisit une seule boîte ou un agent qui choisit deux boîtes, une récompense d'un million de dollars ou un compartiment vide. Le mille dans la boîte transparente n'est pas non plus symbolique ; c'est la base fixe contre laquelle l'ensemble du pari est mesuré. Les montants exacts comptent parce que le cas dépend de l'asymétrie. Une somme garantie plus petite est en vue, tandis qu'une somme beaucoup plus grande dépend de ce qui a déjà été inféré à votre sujet. Le contraste classique — mille dollars contre un million — rend la tentation rationnelle de choisir deux boîtes facile à ressentir et la prétendue supériorité de choisir une seule boîte difficile à accepter.

C'est pourquoi le problème a toujours été discuté comme une confrontation entre des règles de décision. Une règle demande ce que votre acte produira causalement à partir de ce moment. L'autre demande ce que votre acte révèle sur le monde dans lequel vous vous trouvez. Le paradoxe de Newcomb ne demande pas simplement quelle règle est plus élégante. Il demande si un agent pleinement rationnel peut rester cohérent si les deux règles pointent dans des directions différentes. Si la fiabilité du prédicteur est suffisamment élevée, l'argent visible peut être la partie la moins informative de la scène. Ce qui compte, c'est l'alignement caché entre la prédiction antérieure et le comportement ultérieur.

L'idée originale, donc, est suffisamment simple à énoncer mais assez difficile à digérer : le choix rationnel peut nécessiter de choisir l'acte qui s'adapte le mieux à un modèle fiable reliant le choix au résultat, même lorsque ce résultat n'est pas en aval causal de l'acte. Une fois cette affirmation posée, tout le reste du débat découle de la tentative de dire exactement quel type de connexion compte, et pourquoi.