Le mystère du manuscrit de Voynich

21 Juin 2004

Nouvelle analyse d'un document médiéval connu mais crypté suggérant un contenu inintéressant.

Par Gordon Rugg
Traduit de l'anglais par Flyers


En 1912 Wilfrid Voynich, un américain passioné par l'échange de livres rares, fit la découverte de sa vie dans la bibliothèque d'une université Jésuite proche de Rome : un manuscrit d'environ 230 pages, écrit dans un langage peu commun et richement illustré d' images bizarres de plantes, de sphères merveilleuses et de femmes se baignant. Voynich reconnu immédiatement l'importance de cette nouvelle acquisition. Bien qu'il ressemblait superficiellement aux manuels médiévaux d'alchimie ou d'herberisterie, le manuscrit paraissait être entièrement écrit en code. Certaines spécificités des illustrations, comme les coiffures, suggérait que le livre était paru entre 1470 et 1500, et une lettre du 17ème siècle accompagnant le manuscrit déclarait qu'il avait été rechercher par Rudolph II, le Saint Empereur Romain, en 1586. Durant les années 1600, au moins deux disciples ont apparemment essayés de déchiffrer le manuscrit, puis il a disparu durant environ 250 ans jusqu'à ce que Voynich le déterre.


Voynich demanda aux meilleurs cryptographes de son temps de décoder l'étrange manuscrit, qui ne correspondait à aucuns des langages connus. Mais en dépit de 90 ans d'efforts de quelques un des meilleurs casseurs de code au monde, personne n'a été capable de déchiffrer la découverte de Voynich, ainsi le manuscrit est devenu connu. La nature et l'origine du manuscrit reste un mystère. Les échecs des tentatives de cassage du code a augmenté la suspicion qu'il n'y a aucun cryptage à casser. Le texte de Voynich peut ne contenir aucun message du tout, et le manuscrit peut simplement être un canular élaboré.


Les critiques de cette hypothèse ont argumenté que le manuscrit de Voynich est trop complexe pour ne pas avoir de sens. Comment un farceur médiéval peut écrire 230 pages d'un manuscrit avec autant de régularité dans la structure et la distribution des mots? Mais j'ai récemment découvert que l'on peut répliquer plusieurs des dispositifs remarquables de la découverte de Voynich en utilisant un outil simple de codage qui était disponible au 16ème siècle. Le texte générer par cette technique ressemble plus au texte de Voynich, mais c'est du baragouin, sans aucun message caché. Cette découverte ne prouve pas que le manuscrit de Voynich est un canular, mais il soutient la théorie de longue date qu'un aventurier Anglais appeler Edward Kelley peut avoir concocter le document pour tromper Rudolph II.
(L'empereur proposait de payer la somme de 600 ducats--l'équivalent d'environ 50 000 $ actuel--pour le manuscrit.)


Peut-être plus important, je crois que la méthode utilisée pour l'analyse du mystère Voynich peut être appliquée à d'autres questions compliquées dans d'autres domaines. Aborder ce puzzle nécessite des connaissances dans plusieurs domaines, incluant la cryptographie, les langues et l'histoire médiévale. En tant que chercheur sur le raisonnement--l'étude des processus utilisés pour résoudre des problèmes complexes--j'ai vu mon travail sur le manuscrit de Voynich comme un test informel d'une approche qui peut être utilisée pour identifier de nouvelle voies d'aborder des questions scientifique de longue date. L'étape principale est de déterminer les points forts et les faiblesses de l'expertise dans les domaines appropriés.


[NdT: Le titre original ici était "Baby God's Eye?" comme cette phrase ne voulait rien dire je ne savais pas si je devais la traduire en Bébé l'Oeil de Dieu ou L'Oeil de Dieu de Bébé, j'ai donc trancher pour cette deuxième traduction]
L'Oeil de Dieux de Bébé?
Le premier prétendu décryptage du manuscrit de Voynich apparu en 1921. William R. Newbold, un professeur de philosophie à l'Université de Pennsylvanie, clâma que chaque caractère dans le manuscrit de Voynich contenait les courses minuscules d'un stylo qui ne pouvait être vues que grâce à un effet d'optique et que ces courbes formaient un ancien système stéganographique Grecque. Basé sur sa lecture du code, Newbold déclara que le manuscrit de Voynich avait été écrit par Roger Bacon un philosophe-scientifique du 13ème siècle et décrivant des découvertes tel que l'invention du microscope. Cependant, une décennie plus tard, les critiques ont désavoué la solution de Newbold en montrant que les courbes microscopiques des lettres n'était que des fissures naturelles dans l'encre.


Le manuscrit de Voynich a semblé être un code peu commun, une langue inconnue ou un canular sophistiqué.


La tentative de Newbold n'était que le départ d'une longue série d'échecs. Dans les années 1940 les cryptographes amateurs Joseph M. Feely et Leonell C. Strong ont appliqués un algorithme de substitution qui intégré les lettres Romaines à la place des caractères dans la découverte de Voynich, mais la prétendue traduction semblait ne rien signifier. A la fin de la Seconde Guerre Mondiale les cryptographes de l'armée Américaine qui avait casser les codes du Japanese Imperial Navy ont passés quelques temps sur des textes chiffrés de l'antiquité. L'équipe décrypta chacun d'eux à l'exception du manuscrit de Voynich.


En 1978 John Stojko, déclara que le texte était écrit en Ukrainien sans les voyelles, mais sa traduction--qui incluait des phrases tel que "Le vide est ce pourquoi L'oeil de Dieu de Bébé se bat"--n'était ni en accord avec les illustrations du manuscrit ni avec l'histoire Ukrainienne. En 1987 un physicien nommé Leo Levitov affirmait que le document a été écrit par les Cathars, une secte d'hérétiques qui prospérait en France médiévale, et a été écrit dans un pidgin* composé de mots venant de différents langages. La traduction de Levitov, malgré tout, était en désaccord avec la théologie Cathar suffisament documentée.
(*)pidgin: sytème linguistique composite servant à la communication entre gens de parlers différents


En outre, toutes ces combinaisons utilisaient des méchanismes permettant à un même mot du manuscrit de Voynich d'être traduit d'une manière à un endroit du manuscrit et d'une autre façon dans une autre partie du manuscrit. Par exemple, une étape dans la solution de Newbold impliquait le décryptage d'anagrammes, ce qui est notoirement imprécis: l'anagramme ADER, par exemple, pouvait être interprété comme READ, DARE ou DEAR. La plupart des savants s'accordaient sur le fait que tous les essais de décodage du manuscrit de Voynich étaient teintés d'un degré d'ambiguïté inacceptable. D'ailleurs, aucune de ces méthodes ne pourrait encodé un texte en clair vers un texte crypté avec les propriétés les plus importantes du manuscrit de Voynich.


Si le manuscrit n'est pas un code, peut-il être un langage inconnu? Quoique nous ne puissions pas déchiffrer le texte il présente un ensemble extraordinaire de régularité. Par exemple, les mots les plus communs apparaissent souvent deux fois ou plus dans une ligne. Pour représenter les mots, je vais utiliser l'Alphabet Européen de Voynich (European Voynich Alphabet), une convention pour traduire les caractères du manuscrit de Voynich vers des lettres Romaines. Un exemple tiré du folio 78R du manuscrit où nous lisons: "qokedy qokedy dal qokedy qokedy". Ce degré de répétition est introuvable dans les autres langages connus. Réciproquement, Le manuscrit de Voynich ne contient que très peu de phrases où deux ou trois mots différents apparaissent régulièrement ensemble. Ces caractéristiques font qu'il est peu probable que le langage Voynich soit un langage humain--il est simplement trop différent des autres langues.


La troisième possibilité est que le manuscrit était un canular conçu pour un gain monétaire ou qu'il s'agit de la création d'un quelconque alchimiste fou insignifiant. La complexité linguistique du manuscrit semble contredire cette théorie. En plus des répétitions des mots, il y a différentes régularités dans la structure interne des mots. La syllabe commune "qo", par exemple, n'apparait qu'en début de mot. La syllabe "chek" devrait apparaître au début d'un mot, mais si cela se passe dans le même mot que "qo", alors "qo" vient toujours avant "chek". La syllabe commune "dy" apparait généralement à la fin du mot et occasionnellement au début mais jamais à la fin.


Un simple "pick and mix" canular qui combine les syllabes au hasard ne peut produire un texte avec autant de régularités. Le manuscrit de Voynich est également bien plus complexe que n'importe quel discours pathologique dûe à un dommage cérébral ou de désordres psychologiques. Même si un alchimiste fou avait construit une grammaire depuis un langage inventer et après avait passer des années écrivant un manuscrit employant cette grammaire, le texte en résultant ne partagerait pas les différentes spécificités statistiques de la découverte de Voynich. Par exemple, la taille des mots du manuscrit de Voynich forme une distribution binomiale--qui est, les mots les plus communs ont cinq ou six caractères, et le nombre d'occurence des mots avec plus ou moins de caractères diminue rapidement depuis ce pic en une courbe symétrique en forme de cloche. Ce type de distribution est extrêmement peu courant dans un langage humain. Dans presque toutes les langues humaines, la distribution de la taille des mots est plus large et asymétrique, avec un nombre d'occurence plus grand des mots relativement longs. Il est vraiment inhabituel que la distribution binomiale du texte de Voynich aurait pu être délibérément une partie d'un canular, parce que ce concept statistique n'a été inventé que plusieurs siècles après que le manuscrit fût écrit.


Raisonnement d'expert
En résumé, le manuscrit de Voynich apparaissait comme étant un code extrêmement inhabituel, un langage étrange et inconnu ou un canular sophistiqué, et il n'y avait aucune manière évidente pour résoudre le problème. Il se trouvait que ma collègue Joanne Hyde et moi cherchions un tel puzzle quelques années auparavant. Nous avions développé une méthode pour une réévaluation critique de l'expertise et du raisonnement utilisés lors de la recherche de la résolution de problèmes compliqués. Comme test préliminaire, j'ai appliqué cette méthode aux recherches sur le manuscrit de Voynich. J'ai commencé en déterminant les types d'expertises précédemment appliquées au problème.


L'hypothèse que les spécificités du manuscrit de Voynich est contradictoire à n'importe quel langage humain était basé sur les expertises substantielles appropriées des linguistes. Cette conclusion semblait juste, alors j'ai procédé à l'hypothèse du canular. La plupart des personnes qui ont étudiées le manuscrit de Voynich s'entendait pour dire que le texte de Voynich était trop complexe pour être un canular. J'ai trouver, malgré tout, que cette opinion était plus basée sur des intuitions plutôt que sur des évidences. Il n'y a aucun corps d'expertise sur la façon d'imiter un long texte chiffré médiéval, car il est difficile de trouver des exemples de tels textes, encore moins de canulars de ce genre.


Plusieurs chercheurs, comme Jorge Stolfi de l'Université de Campinas au Brésil, s'était demandé si le manuscrit de Voynich a été réalisé en utilisant un générateur de texte utilisant des tables aléatoires. Ces tables ont des cellules contenant des caractères et des syllabes; l'utilisateur sélectionne une séquence de cellules--peut-être en lançant des dés--et les combines pour former un mot. Cette technique peut générer certaines des régularités dans les mots du texte de Voynich. Avec la méthode de Stolfi, la première colonne de la table peut contenir des syllabes préfixes, comme "qo", apparaissant seulement au début des mots; la deuxième colonne peut contenir des "midfixes" (des syllabes apparaissant au milieu des mots) comme "chek", et la troisième colonne peut contenir des syllabes suffixes comme "y". Le choix d'une syllabe de chaque colonne dans l'ordre produirait des mots avec la structure caractéristique du manuscrit de Voynich. Certaines des cellules doivent être vide, de sorte que l'on puisse créé des mots manquant d'un prefixe, d'un "midfix" ou d'un suffixe.


L'aventurier Edward Kelley a dûe concocter le document pour tromper Rudolph II, le Saint Empereur Romain.


Les autres spécificités du texte de Voynich, malgré tout, ne sont pas facilement reproductibles. Par exemple, certains caractères sont individuellement habituels mais n'apparaissent que rarement à la suite. Les caractères traduits en a, e ou l sont communs, tout comme la combinaison al, mais la combinaison el est très rare. Cet effet ne peut être reproduit en mélangeant aléatoirement les caractères d'une table, ainsi Stolfi et les autres ont rejetés cette approche. Le terme clé ici, quoique, est "aléatoirement". Pour les chercheurs modernes, l'aspect aléatoire est un concept de valeur inestimable. Pourtant c'est un concept développé longtemps après que le manuscrit ait été écrit. Un canular médiéval aurait probablement employé une manière différente de combiner les syllabes qui ne pourraient pas être aléatoires dans le sens statistique strict. J'ai commencé à me demander si certaines des spécificités du texte de Voynich pourraient être la conséquence d'un dispositif obsolète ancien.


La Grille de Cardan
C'était comme si l'hypothèse du canular méritait davantage de recherche. Ma prochaine étape était de tenter de produire un faux document pour voir les attributs du résultat. La première question était, quelle technique utiliser? La réponse dépendait de la date à laquelle le manuscrit fût écrit. Ayant travailler dans l'archéologie, un domaine dans lequel dater les objets est une chose importante, je me méfiais du consensus général des chercheurs ayant travailler sur le document de Voynich disant que le manuscrit avait été créé avant 1500. Il était illustré dans le style de la fin des années 1400, mais cet attribut ne donnait pas la date d'origine du document de façon concluante; les travaux artistiques sont toujours réalisés dans le style d'un peu avant une période, innocemment ou pour faire croire que le document est plus vieux. J'ai donc recherché une technique de codage existante dans la plus grande brochette possible de dates d'origine du manuscrit--entre 1470 et 1608.


Une possibilité prometteuse était la grille de Cardan, qui avait été inventée par le mathématicien Italien Girolamo Cardano en 1550. Elle consiste en une carte avec des fentes découpées dedans. Quand la grille est déposée au-dessus d'un texte apparemment innocent réalisé avec la même copie de la carte, les fentes revèle les mots du message caché.
J'ai réalisé qu'une grille de Cardan avec trois fentes pouvais être utilisée pour choisir les permutations des préfixes, des "midfixes" et des suffixes depuis une table pour générer des mots dans le style de ceux du texte de Voynich.

Une page typique du manuscrit de Voynich contient environ de 10 à 40 lignes, chacune constituée d'environ 12 mots. En utilisant le modèle trois-syllabe du texte de Voynich, une simple table de 36 colonnes et de 40 lignes contiendrait assez de syllabes pour produire une page entière du manuscrit avec une grille simple. La première colonnes listerais les préfixes, la seconde les "midfixes" et la troisième les suffixes; les colonnes suivantes répèteraient ce modèle. Vous pouvez aligner la grille au coin supérieur gauche de la table pour créé le premier mot du texte de Voynich et ensuite la déplacer de trois colonnes vers la droite pour créer le prochain mot. Ou vous pouvez déplacer la grille une colonne plus loin vers la droite ou sur une ligne plus basse. En positionnant successivement la grille au-dessus des différentes parties de la table, vous pouvez créer des centaines de mots comme dans le texte de Voynich. Et la même table peut être utilisée avec une grille différente pour créer les mots de la page suivante.


J'ai élaboré trois tables à la main, ce qui a pris deux ou trois heures par table. Il m'a fallu deux ou trois minutes pour découper chaque grille. (J'en ai fait 10). Après cela, j'ai pu générer du texte aussi vite que je pouvais le transcrire. En tout, j'ai réalisé entre 1 000 et 2 000 mots de cette façon.


J'ai découvert que cette méthode pouvait facilement reproduire la plupart des spécificités du texte de Voynich. Par exemple, vous pouvez vous assurer que certains caractères ne puissent apparaître ensemble en dessinant soigneusement les tables et les grilles. Si les fentes successives de la grille sont toujours sur des lignes différentes, alors les syllabes dans les cellules horizontalement adjacentes dans la table n'apparaîtrons jamais ensemble, même si elles peuvent être habituelles individuellement. La distribution binomiale des tailles des mots peut être générée en mélangeant des syllabes courtes, moyennes et longues dans la table. Une autre caractéristique du texte de Voynich--le fait que le premier mot d'une ligne tend à être plus long que les suivants--peut être reproduit simplement en mettant la pluspart des syllabes longues du côter gauche de la table.


La méthode de la grille de Cardan fait donc apparaître qu'il s'agit d'un mécanisme par lequel le manuscrit de Voynich a pu être créé. Mes reconstitutions suggérent qu'une personne aurait pu produire le manuscrit, en incluant les illustrations, en seulement trois ou quatre mois. Mais une question cruciale reste en suspend: Est-ce que le manuscrit ne contient qu'un baragouin incompréhensible ou un message codé?


J'ai trouvé deux manières d'employer les grilles et les tables pour encoder et décoder du texte en clair. La première était un chiffrement qui convertissait le texte en clair en des syllabes "midfix" qui sont ensuite incorporées dans des préfixes et des suffixes sans signification en utilisant la technique décrite ci-dessus. La seconde technique d'encodage assignait un nombre pour chaque caractère du texte en clair et utilisait ensuite ces nombres pour spécifier le placement de la grille de Cardan au-dessus de la table. Les deux techniques, malgré tout, produisent des textes avec moins de répétition de mots que le texte de Voynich. Cette conclusion indique que la grille de Cardan était en effet utilisée pour créer le manuscrit de Voynich, l'auteur a probablement abilement créé un texte sans aucun sens plutôt qu'un texte crypté. Je n'ai trouvé aucune preuve évidente que le manuscrit contient un message codé.


Cette absence d'évidence ne prouve pas que le manuscrit était un canular, mais mon travail montre que la construction d'un canular aussi complexe que le manuscrit de Voynich était en effet faisable. Cette explication coïncide avec différents faits historiques intrigants: John Dee, un disciple d'Elizabeth, et son déshonorant associer Edward Kelley visitèrent la court de Rudolph II durant les années 1580. Kelley était un forgeur reconnu, mystique et alchimiste qui connaissait les grilles de Cardan. Certains experts du manuscrit de Voynich ont longtemps cruent que Kelley en était l'auteur.


Ma subalterne, l'étudiante Laura Aylward enquête actuellement pour voir si des dispositifs statistiques plus complexes du manuscrit peuvent être reproduit en utilisant la technique de la grille de Cardan. La réponse à cette question nécessitera la production de grandes quantité de texte en utilisant différentes tables et grilles, alors nous écrivons un logiciel permettant d'automatiser la méthode.


Cette étude nous a ouvert de nouveaux horizons quant à la réexamination de problèmes difficiles pour déterminer si des solutions possibles ont été négligées. Un bon exemple d'un tel problème est la question de ce qui cause la maladie d'Alzheimer. Nous planifions d'examiner si notre approche pourrait être utilisée pour réévaluer les recherches précedentes dans ce désordre mental. Nos questions incluerons: les investigateurs ont-ils négligés un champ d'expertise nécessaire? Et y a-t-il quelques subtiles malentendus entre les différentes disciplines mises en application dans ce travail? Si nous pouvons utiliser ce processus pour aider les chercheurs en matière de la maladie d'Alzheimer cela nous permettra de découvrir de nouveaux horizons très prometteurs, alors un manuscrit médiéval qui ressemblait à un manuel d'alchimiste s'avèrerais être un avantage pour la médecine moderne.


GORDON RUGG a commencé à être intéresser par le manuscrit de Voynich il y a de cela quatre ans. Au début il le voyait simplement comme un puzzle intrigant, mais après il le vit comme un essai pour réexaminer des problèmes complexes. Il obtenu son Ph.D. (doctorat) en philosophie à l'Université de Reading en 1987. Maintenant grand conférencier à l'Ecole de Calcul et des Mathématiques (School of Computing and Mathematics) à l'Université de Keele en Angleterre, Rugg est éditeur en chef de "Expert Systems": Le Journal International de l'Ingénierie Cognitive et des Réseaux Neuronnaux. Ses recherches portent sur des sujets comme la nature de l'expertise et le modélage des informations, connaissances et croyances.