【後編】は、手稿の暗号解読に関する取り組みについて解説、更に暗号以外の説について紹介します。
いよいよ最終回、代表的な奇書のひとつである「ヴォイニッチ手稿」の謎、是非、お楽しみください!!
解読の最初の課題は、この古文書の文章がいったい何語で書かれているのか、ということでした。暗号化で変形されていたとしても、その元の姿がラテン語なのか、中世英語なのか。 はたまた現在では消滅してしまった何れかの古語なのか・・・。
「ヴォイニッチ手稿」では、そもそも記載されている文字自体が誰も見たこともない奇妙な文字であり、その文字列は言語としての一般的な構成や構造を有しているものの、多くの学者や研究家が調べたところでは、ラテン語、ギリシャ語、英語、フランス語、イタリア語、ドイツ語、サンスクリット語、ヘブライ語等のどの言語とも一致しない文字を使用して書かれています。
現在までの研究の成果としては、この古文書は、どちらかと云えばラテンアルファベットに似た文字か、もしくは知られているどの様な文字にも似ていない特殊な人工文字によって書かれていますが、完全なデタラメの羅列ではなく言語学的解析に照らし合わせ、何らかの言語として成立している可能性があり、その為に暗号化されているとの考えが有力なのです。
しかし、各文字や文字列の登場頻度などを言語学の統計的手法で解析した結果、確かに意味を持つ文章列であると判断されてはいるのですが、発見から1世紀以上経た現在でも未だ解読には至っていません。
「ヴォイニッチ手稿」で使用されている文字はヴォイニッチ文字と言われており、その数も研究者により15字~40字までと諸説があります。
ヴォイニッチ文字で構成された単語は、繰り返しがとても多いという特徴があり、一部を変えただけの単語も数多くあります。
また、1文字や2文字という短い単語が極めて少なく、反対に10文字以上の長い単語も稀で、平均すると5文字前後の単語が中心となっています。そしてヴォイニッチ文字の中には、特定のページでの使用頻度が高いものや、接頭語や接尾語の様に、特定の単語の前や後ろに頻繁に現れるものが存在します。
全体的に、現在一般的に使われている言語と似た特徴を持つ一方で、一部の単語の頻繁な繰り返しのように、同様の文法を持った類似の言語が見当たらないという不思議な性格も併せ持っています。
さて、「ヴォイニッチ手稿」の正体に関する諸説の中で最も有力なのは、先ずは暗号説です。
暗号にはいくつか種類がありますが、「ヴォイニッチ手稿」で暗号が使われているとすれば、それは「サイファ(Cipher, Cypher)」と呼ばれるものだと考えられています。 そしてサイファとは、メッセージを基本的に一文字もしくは複数単位で、所定のルール/アルゴリズムに従って別の文字もしくは数字などに置き換える暗号システムのことです。
このサイファの中でも古典的なタイプには大きく「転置式」と「換字(かえじ)式」の二つがありますが、転置式とは端的に言えば文字の並べ替えのことです。
例えば、「ABCD EFG HIJK LMN」という文章があったとして、それを転置式で暗号化した場合、一例ですが「JNH AMIC LD BG KFE」や「LEH BN DI GCK MAFJ」などと表せます。この転置式は、比較的短い文章であれば、元の文章を復元することは不可能ではありません。(「ゴリン」から「リンゴ」を導き出すなど)
しかし長くなるにつれ、並べ替えの組み合わせは天文学的な数字(文字数をn とするとき並べ方はn!-1〈-1は元の平文の分〉の可能性がある)となる為、並べ替えの単位(ブロック)となる文字数n が多いと暗号化と復号が非常に困難になり、少ないと並べ替えの総数が少なくなり、暗号としての難易度が極端に低くなるといった欠点があります。
つまり「ヴォイニッチ手稿」のように、約230ページにも及ぶ古文書に長文が書かれている場合、いくら繰り返しが多いとはいえ、このような多量の文章量を正確に並べ替えて元の文章に復号することは事実上不可能です。現代であればスーパーコンピューターを長時間稼働させて、トライアルさせる方法はありますが・・・。
そもそも暗号というものは、敵対者などの他者には内容を隠しつつ、正しい連絡相手には正確な情報を伝えることが本来の目的です。そこでどんなに秘匿性が高くても、元の文章に正確に復号ができなければ暗号としての価値がありません。
その為、この手稿が転置式の暗号だけで構成されている可能性は極めて低いのです。それは現代でも大変困難な復号作業ですが、中世の時代にこれだけ多くの転置式暗号文を正しく復号出来たとは、尚更思えないからです。
それでは換字(かえじ)式はどうでしょうか。換字式は転置式と違い、元の文章の文字の順番は変わりません。その代わり、文字そのものが別の文字や数字に置き換わります。つまり、転置式の場合は使われる文字はそのままですが位置が変わり、換字式は文字が変わって位置はそのまま、ということです。
元の文章を、1文字または数文字単位で別の文字や記号等にある一定のルール/アルゴリズムに基づいて変換することで暗号文を作成する手法です。
例えば、次のようになります。
元の文章が「ABCD EFG HIJK LMN」だった場合に、暗号文が「DEFG HIJ K LMN OPQ」となっているもの。
これは最も単純な例の一つで、アルファベットの順番が3文字後ろにずれているものです。複号する際にはこのルールに従い、暗号文のアルファベットを各々3文字前にずらして変換すれば良いのです。つまり「D」は「A」、「R」は「O」となります。
このずらし方式(シーザー式暗号とも呼ばれる)を英語のアルファベットでやった場合、ずらし方は25通りしかありませんから、簡単に暗号は破られてしまいます。
そこで、より複雑な方法として、すべての文字を同じ数だけずらすのではなく、特定のアルファベット毎に、ずらす数を変えるという方法があります。つまり、上記の例ではA~Nまですべて後ろに3文字ずらしていたものを、例えば「A」は3文字、「B」は11文字、「C」は7文字というように、文字ごとにずらす数が変わるものです。
この場合、変換のルールを知らない者にとっては、想定しなければならないずらし方が膨大になる為、そう簡単には解読は出来ないことになります。
この方式は「単文字換字法」と呼ばれますが、もし「ヴォイニッチ手稿」が暗号文書であれば、この単文字換字法が使われている可能性が高いと考えられてきました。
更に複雑な「複式換字法」という方法もありますが、その使用の可能性は否定されています。何故ならば、この複式換字法で作成した暗号文書は、規則性がなく無秩序な文字の羅列になる傾向があるのですが、「ヴォイニッチ手稿」はそれほど無秩序ではなく、一定の規則性を持っている様に見えるからです。
さて、単文字換字法を解読するには、「頻度解析」という方法が使われます。言語によって使われる文字の出現回数(頻度)は異なっており、それぞれに特徴があります。たとえば英語を例にとると、最も頻度が高く現れるのは「e」で、次が「t」、最も出現頻度が少ないのは「z」となります。
そして一般的には暗号化された文章も、元の言語の頻度がそのまま反映される傾向にあるのです。この為に暗号文書の文字の出現頻度を調べて元の言語を推測して当て嵌めていくことで、解読が成功する可能が出てきます。
しかし「ヴォイニッチ手稿」では、先ず現在までヴォイニッチ文字が確定されずに15~40字までと幅広く諸説があり、また手書きで流麗な筆記体であるため、同一文字なのか異なる文字なのか判別が難しい場合が多数あることで、この文字の出現頻度の計測は困難でした。以前には、29個の文字または記号を使用しているとの説もありましたが、これを既知の言語に戻す作業は上手くいきませんでした。
《広告》