日本語の起源と歴史に興味を持つすべての方へ

本ブログの記事一覧はこちら

こんにちは。金平譲司と申します。ここに「日本語の意外な歴史」と題するブログを立ち上げました。

このブログは、日本語ならびに日本語と深い関係を持つ言語の歴史を解明するものです。言語学者だけでなく、他の分野の専門家や一般の方々も読者として想定しています。

謎に包まれてきた日本語の起源

日本語はどこから来たのかという問題は、ずいぶん前から様々な学者によって論じられてきましたが、決定的な根拠が見つからず、大いなる謎になってしまった感があります。しかしながら、筆者の研究によってようやくその全貌が明らかになってきたので、皆さんにお話ししようと思い立ちました。

日本語は、朝鮮語、ツングース諸語(エヴェンキ語、満州語など)、モンゴル諸語(モンゴル語、ブリヤート語など)、テュルク諸語(トルコ語、中央アジアの言語など)と近い関係にあるのではないか、あるいはオーストロネシア語族(台湾、フィリピン、インドネシア、マレーシア、オセアニアなどの言語から成る言語群)と近い関係にあるのではないかというのが従来の大方の予想でしたが、これらの予想はポイントを外しています。

中国語を見て全く違うと感じた日本人が、日本語は北方の言語と関係があるのではないか、南方の言語と関係があるのではないかと考えたのは、至極当然のことで、北方の言語と南方の言語に視線を注ぐこと自体は間違っていません。問題なのは、北方のごく一部の言語と南方のごく一部の言語に関心が偏ってしまったことです。

上記の言語のうちで、朝鮮語、ツングース諸語、モンゴル諸語、テュルク諸語は、日本語によく似た文法構造を持つことから、日本語に近縁な言語ではないかと盛んに注目されてきました。同時に、ツングース諸語、モンゴル諸語、テュルク諸語は、互いに特に近い関係にあるとみなされ、いわゆる「アルタイ語族」という名でひとまとめにされることがしばしばありました。日本語の起源をめぐる議論は、このような潮流に飲まれていきました。

しかしながら、筆者がこれから明らかにしていく歴史の真相は、かなり違います。日本語は、朝鮮語、ツングース諸語、モンゴル諸語、テュルク諸語と無関係ではないが、別の言語群ともっと近い関係を持っているようなのです。

実を言うと、筆者は日本語やその他の言語の歴史に興味を持つ人間ではありませんでした。筆者は若い頃にフィンランドのヘルシンキ大学で一般言語学や様々な欧州言語を学んでいましたが、その頃の筆者の興味は言語と思考の関係や外国語の学習理論などで、もっぱら現代の言語に関心が向いていました。歴史言語学の講義もありましたが、特に気に留めていませんでした。

筆者が言語の歴史について真剣に考えるようになったきっかけは、ロシアの北極地方で少数民族によって話されているサモエード諸語との出会いでした。サモエード諸語は、フィンランド語やハンガリー語と類縁関係にある言語です。フィンランド語とハンガリー語はヨーロッパの中では異色の存在で、北極地方の少数民族の言語と類縁関係を持っています。フィンランド語、ハンガリー語、サモエード諸語などから成る言語群は、「ウラル語族」と呼ばれます。

言語学者が使う「語族」という用語について若干説明しておきます。私たちが万葉集や源氏物語の言葉を見ると、「読みにくいな」と感じたり、「なにを言っているのかわからないな」と感じたりします。言語は時代とともに少しずつ変化しています。言語は単に変化するだけでなく、分化もします。ある程度広い範囲で話されている言語には、地域差が生じてきます。

この地域ごとに少しずつ異なる言葉が方言です。しかし、これらの方言が地理的に隔たってさらに長い年数が経過すると、最初は小さかった方言同士の差が大きくなっていき、やがて意思疎通ができないほどになります。

あまりに違いが大きくなれば、もう方言ではなく、別々の言語と言ったほうがふさわしくなります。一律の学校教育やマスメディアが発達していない時代には、この傾向は顕著です。ある言語が別々の言語に分化するのです。分化してできた言語がさらに分化することもあります。言語学では、おおもとの言語と分化してできた諸言語をまとめて「語族」といいます。世界で最もよく知られている語族は、インド・ヨーロッパ語族と呼ばれる語族で、英語、ドイツ語、フランス語、ロシア語などはこの語族に属します。例えるなら、イヌ、オオカミ、キツネ、タヌキが共通祖先を持っているように、英語、ドイツ語、フランス語、ロシア語は共通祖先を持っているということです。

日本語とウラル語族

英語などが属するインド・ヨーロッパ語族は巨大な言語群ですが、フィンランド語やハンガリー語が属するウラル語族はこじんまりとした言語群です。ウラル語族の言語は、ロシアの北極地方から北欧・東欧にかけて分布しています。地理的に遠く離れているので、ウラル語族の言語は一見したところ東アジアの言語、特に日本語とはなんの関係もないように見えますが、実はここに大きな盲点があります。日本語の歴史を考えるうえで大変重要になるので、ウラル語族の話を続けます。以下にウラル語族の内部構造を簡単に示します。

ウラル語族の言語を研究する学者の間に意見の相違がないわけではありませんが、上の図は従来広く受け入れられてきた見方です。ウラル語族の言語は、まずフィン・ウゴル系とサモエード系に分かれ、フィン・ウゴル系はそこからさらにフィン系とウゴル系に分かれます。フィンランド語はフィン系に属し、ハンガリー語はウゴル系に属します。サモエード系の言語は、ロシアの北極地方に住む少数民族によって話されています。現在残っているサモエード系の言語はネネツ語、エネツ語、ガナサン語、セリクプ語の四つのみで、特に後の三つは消滅の危機にあります。

サモエード系の言語は、フィンランド語やハンガリー語と同じウラル語族の言語ですが、フィンランド語やハンガリー語とは文法面でも語彙面でも著しく異なっています。同じ言語から分かれた言語同士でも、別々の道を歩み始め、何千年も経過すれば、似ても似つかない言語になってしまいます。特に、サモエード系の言語が辿った運命とフィンランド語・ハンガリー語が辿った運命は対照的です。サモエード系の言語は、北極地方にとどまり、他の言語との接触が比較的少なかったために、昔の姿をよく残しています。それに対して、フィンランド語とハンガリー語は、有力な言語がひしめくヨーロッパに入り込み、大きく姿を変えました。サモエード系の言語は、いわば「生きた化石」です。人類の歴史を解明するうえで、大変重要な言語です。サモエード系の言語との出会いは、筆者にとってショッキングな出来事でした。これ以降、筆者は言語の歴史について本格的に研究し始めることになります。

筆者が初めてサモエード系の言語を見た時には、「文法面ではモンゴル語やツングース諸語に似ているな」という第一印象を受けました。しかし、よく調べると、「あれっ、語彙面では日本語に似ているな」という第二印象を受けました。少なくとも言語の根幹をなす基礎語彙に関しては、モンゴル語やツングース諸語より、ウラル語族のサモエード系の言語のほうが日本語に近いと思いました。なんとも不思議な感じがしました。なんで日本の近くで話されているモンゴル語やツングース諸語より、北極地方で話されているウラル語族のサモエード系の言語のほうが日本語に近いんだろうと考え始めました。様々な言語を見てきましたが、サモエード系の言語には今までにない特別なものを感じました。なにか重大な秘密が隠されている予感がしました。

フィンランド語とハンガリー語だけを見ていた時は気づかなかったのですが、サモエード系の言語を介しながらフィンランド語とハンガリー語を見てみると、やはりフィンランド語とハンガリー語にも日本語との共通語彙があります。日本語の中にある、ウラル語族と共通している語彙、そしてウラル語族と共通していない語彙を見分けていくうちに、二つの疑問が頭に浮かんできました。一つ目の疑問は、日本語の祖先とウラル語族の言語の祖先の接点は地理的にどの辺にあったのだろうという疑問です。二つ目の疑問は、日本語の中にある、ウラル語族と共通していない語彙はどこから来たのだろうという疑問です。日本語の中には、ウラル語族と共通している語彙も多いですが、共通していない語彙も多いのです。

東アジアには黄河文明とは違う文明が存在した

ウラル語族の各言語の語彙を研究するうちに、ウラル語族が日本語だけでなく、モンゴル語、ツングース諸語、朝鮮語、さらには中国語にもなんらかの形で関係していることが明らかになってきたので、ウラル語族の言語と東アジア・東南アジアの言語の大々的な比較研究を開始しました。着実かつ合理的に歴史を解明するため、考古学および生物学の最新の研究成果を適宜参照しました。考古学も生物学も近年めざましい発展を遂げており、数々の重要な発見がありました。

かつては、メソポタミア文明、エジプト文明、インダス文明、そして東アジアの黄河文明が並べられ、世界四大文明と呼ばれていました。ところが、その後の発見によって、東アジアには黄河文明のほかに二つの大きな文明が存在したことがわかってきました(このテーマを包括的に扱った書籍はいくつかありますが、考察の広さ・深さの点でShelach-Lavi 2015が優れています)。

その二つの大きな文明とは、長江文明と遼河文明(りょうがぶんめい)です。日本列島で縄文時代が進行する間に、大陸側はこのようになっていたのです。黄河文明と長江文明に比べて、遼河文明は知名度が高くないかもしれません。しかし、遼河文明は、日本語の歴史を解明するうえで重要な鍵を握っているようなのです。

生物学が発達し、人間のDNA配列が調べられるようになりました。DNA配列は、正確には「DNAの塩基配列」といい、アデニンA、チミンT、グアニンG、シトシンCという四種類の物質が作る列のことです。最近では、生きている人間のDNA配列だけでなく、はるか昔に生きていた人間のDNA配列も調べられるようになってきました。大変興味深いことに、遼河文明が栄えていた頃に遼河流域で暮らしていた人々のDNA配列を調べた研究があります(Cui 2013)。

人間は父親と母親の間に生まれるので、子のDNA配列が父親のDNA配列と100パーセント一致することはなく、子のDNA配列が母親のDNA配列と100パーセント一致することもありません。しかし、父親から息子に代々不変的に受け継がれていく部分(Y染色体DNA)と、母親から娘に代々不変的に受け継がれていく部分(ミトコンドリアDNA)があります。代々不変的に受け継がれていく部分と書きましたが、この部分にも時に突然変異が起きます。つまり、その部分のDNA配列のある箇所が変化するのです。変化していないY染色体DNA配列を持つ男性がそれを息子に伝える一方で、変化したY染色体DNA配列を持つ男性がそれを息子に伝えるということが起き始めます。同様に、変化していないミトコンドリアDNA配列を持つ女性がそれを娘に伝える一方で、変化したミトコンドリアDNA配列を持つ女性がそれを娘に伝えるということが起き始めます。こうして、時々起きる突然変異のために、Y染色体DNAのバリエーション、ミトコンドリアDNAのバリエーションができてきます。人類の歴史を研究する学者は、このY染色体DNAのバリエーション、ミトコンドリアDNAのバリエーションに注目するのです。

先ほど述べた遼河流域の人々のDNA研究は、Y染色体DNAのバリエーション(例えば、C系統か、D系統か、N系統か、O系統か)を調べたものです。その結果はどうだったでしょうか。古代の人々の研究なのでサンプル数は限られていますが、それでも大まかな傾向は十分に捉えられています。遼河文明が栄えていた頃の遼河流域では、当初はN系統が圧倒的に優勢だったが、次第にO系統とC系統が増え(つまり他の地域から人々が流入してきたということ)、N系統はめっきり少なくなってしまったようです。現在の日本、朝鮮半島、中国では、N系統はほんの少し見られる程度です(Shi 2013)。対照的に、ウラル語族の言語が話されているロシアの北極地方からフィンランド方面にかけてN系統が非常に高い率で観察されています(Rootsi 2007)。

見え始めた日本語の正体

筆者もウラル語族の言語が東アジアの言語と深い関係を持っていることを知った時には大いに驚きましたが、考古学・生物学の発見と照らし合わせると、完全に合致します。日本語がウラル語族の言語と深い関係を持っていることは非常に興味深いですが、もう一つ興味深いことがあります。日本語の中には、ウラル語族と共通している語彙も多いですが、共通していない語彙も多く、ウラル語族とは全く異なる有力な言語群も日本語の形成に大きく関与したようなのです。

ウラル語族の言語と東アジア・東南アジアの言語の大々的な比較研究を行い、様々な紆余曲折はありましたが、漢語流入前の日本語(いわゆる大和言葉)の語彙構成が以下のようになっていることがわかってきました。

「ウラル語族との共通語彙」も多いですが、「黄河文明の言語との共通語彙」と「長江文明の言語との共通語彙」も多く、この三者で漢語流入前の日本語の語彙の大部分を占めています。

「その他の語彙1」というのは、日本語が大陸にいた時に取り入れた語彙で、「ウラル語族との共通語彙」にも、「黄河文明の言語との共通語彙」にも、「長江文明の言語との共通語彙」にも該当しないものです。

「その他の語彙2」というのは、日本語が縄文時代に日本列島で話されていた言語から取り入れた語彙です。

漢語流入前の日本語の語彙構成の特徴的なところは、なんといっても、語彙の大きな源泉が三つあることです。三つの有力な言語勢力が交わっていたことを窺わせます(遼河文明と黄河文明と長江文明の位置を思い出してください)。

「日本語の意外な歴史」では、ウラル語族との共通語彙、黄河文明の言語との共通語彙、長江文明の言語との共通語彙、その他の語彙1、その他の語彙2、いずれも詳しく扱っていきます。

では、日本語およびその他の言語の歴史を研究するための準備に取りかかりましょう。

 

外国語の単語の表記について

英語と同じようなアルファベットを使用している言語では、それをそのまま記します。言語学者が諸言語の発音を記述するのに使う国際音声記号(IPA)というのがありますが、音韻論の専門家でない限り、多くが見慣れない記号です。そのため、本ブログではIPAの使用はできるだけ控えます。特に朝鮮語は、IPAを用いて記すと複雑になるため、市販されている初心者向けの韓国語の文法書で採用されている書き方にならいました。一般の読者にとって見慣れない記号を用いる場合には、補助としてのカタカナ表記を付け加えます。慣習を考慮し、ヤ行の子音は基本的に、北方の言語(ウラル語族の言語など)では「j」で表し、南方の言語(中国語、東南アジアの言語)では「y」で表します。古代中国語のアルファベット表記の仕方は、Baxter 2014に従います。

 

参考文献

Baxter W. H. et al. 2014. Old Chinese: A New Reconstruction. Oxford University Press.

Cui Y. et al. 2013. Y chromosome analysis of prehistoric human populations in the West Liao River Valley, Northeast China. BMC Evolutionary Biology 13: 216.

Rootsi S. et al. 2007. A counter-clockwise northern route of the Y-chromosome haplogroup N from Southeast Asia towards Europe. European Journal of Human Genetics 15: 204-211.

Shelach-Lavi G. 2015. The Archaeology of Early China: From Prehistory to the Han Dynasty. Cambridge University Press.

Shi H. et al. 2013. Genetic evidence of an East Asian origin and paleolithic northward migration of Y-chromosome haplogroup N. PLoS One 8(6): e66102.


►言語の歴史を研究するための準備へ

かすかに浮かび上がる朝鮮語とアイヌ語の起源

前に英語のwater(水)、wet(濡れている)、ラテン語のaqua(水)、umidus(濡れている)という語を取り上げたことがありました。

ウラル語族のフィンランド語ではvesi(水)、märkä(濡れている)マルカと言い、ハンガリー語ではvíz(水)ヴィーズ、nedves(濡れている)と言います。

英語のwet(濡れている)がwater(水)と同源であることはお話ししました。ラテン語のumidus(濡れている)が古代北ユーラシアで水を意味したam-、um-、om-のような語から来ていることもお話ししました。では、フィンランド語のmärkä(濡れている)とハンガリー語のnedves(濡れている)はどうでしょうか。フィンランド語のmärkä(濡れている)とハンガリー語のnedves(濡れている)はウラル語族の標準的な語彙ではなく、古代北ユーラシアとの関係を考えなければなりません。

まずは、フィンランド語のmärkä(濡れている)について考察しましょう。古代北ユーラシアに水のことをmärkäのように言う言語があって、そこからフィンランド語のmärkä(濡れている)が来たという可能性はどうでしょうか。これはほぼ確実です。ウラル語族の語彙だけでなく、インド・ヨーロッパ語族の語彙も見ると、よくわかります。

皆さんもご存じのように、英語にはmarkという語があります。英語のmarkは、今では印(しるし)を意味していますが、もともと境界を意味していた語です。余白を意味したり、利ざやを意味したりしている英語のmarginは、端の部分や境界の部分を意味していたラテン語のmargoから来ています。

昨今の企業の統合・合併の話でよく出てくる英語のmergeも、水の中に入ることを意味したラテン語のmergereから来ています。水の中に入るところから、混ざるや融合するのような意味が生まれてくるわけです。ちなみに、ラテン語のmergereは水の中に入ること、emergereは水の中から出ることを意味し、後者は英語のemerge(現れる)になっています。なにかが現れること、特に突然現れることを意味するようになっていったのが英語emergent/emergencyです。

上記の英語のmarkやラテン語のmargoも怪しいですが、古英語mere(海)(この語は廃れましたが、ドイツ語のMeer(海)は健在です)、ラテン語mare(海)、ロシア語more(海)、リトアニア語marios(潟)なども怪しいです。

古代北ユーラシアに水のことをmark-、mirk-、murk-、merk-、mork-のように言う言語群があったのではないか、さらに、連続するrとkのどちらかが脱落してmar-、mir-、mur-、mer-、mor-あるいはmak-、mik-、muk-、mek-、mok-のような形が生じていたのではないかと考えたくなります。フィンランド語のmärkä(濡れている)、meri(海)、mäki(丘)などは、まさにそのような例です(水・水域を意味していた語がその隣接部分、特に盛り上がり、坂、丘、山などを意味するようになるパターンを思い出してください)。

水のことをmark-、mirk-、murk-、merk-、mork-(mar-、mir-、mur-、mer-、mor-、mak-、mik-、muk-、mek-、mok-)のように言う言語群は、ヨーロッパ方面から東アジア方面まで大きく広がっていたようです。東アジアの遼河流域のずっと北のほうには、以前にお話しした巨大なレナ川が流れています。レナ川にはたくさんの支流が流れ込んでおり、マルハ川(Markha River)と呼ばれる支流が二つあります。かつてレナ川流域に住んでいた人々が水または水域のことをmarkhaのように言っていたことが窺えます。

そして、なんといっても注目すべきなのは、モンゴル語mɵrɵn(川)ムルン、エヴェンキ語mū(水)ムー、ナナイ語mue(水)ムウ、満州語muke(水)ムク、朝鮮語mul(水)などの語が見られることです。朝鮮語のmulの古形はmɨrミルです。モンゴル語にはus(水)という語があり、モンゴル語mɵrɵn(川)は外来語と考えられますが、エヴェンキ語mū(水)、ナナイ語mue(水)、満州語muke(水)、朝鮮語mul(水)は外来語とは考えづらいです。かつて水のことをmark-、mirk-、murk-、merk-、mork-(mar-、mir-、mur-、mer-、mor-、mak-、mik-、muk-、mek-、mok-)のように言う巨大な言語群が存在したが、その大部分は消滅し、一部がツングース諸語や朝鮮語として残ったのではないか、そんな展開が考えられます。

古代北ユーラシアに水のことをmark-、mirk-、murk-、merk-、mork-(mar-、mir-、mur-、mer-、mor-、mak-、mik-、muk-、mek-、mok-)のように言う巨大な言語群が存在したことが明らかになってきましたが、これによって考えなければならない問題がいくつも出てきます。

現在ヨーロッパ方面から東アジア方面に残っている言語の語彙を分析する限り、かつて北ユーラシアに、水のことをjak-、jik-、juk-、jek-、jok-のように言う巨大な言語群、水のことをam-、um-、om-のように言う巨大な言語群、そして水のことをmark-、mirk-、murk-、merk-、mork-(mar-、mir-、mur-、mer-、mor-、mak-、mik-、muk-、mek-、mok-)のように言う巨大な言語群が存在したと考えられます。しかし、jak-、jik-、juk-、jek-、jok-という語形、am-、um-、om-という語形、そしてmark-、mirk-、murk-、merk-、mork-(mar-、mir-、mur-、mer-、mor-、mak-、mik-、muk-、mek-、mok-)という語形は、互いに大きく異なります。

国家や国境が幅を利かせている現代に生きる私たちは、以下のような単純な言語分布を考えがちです(左側がヨーロッパ方面で、右側が東アジア方面だと考えてください)。

しかし、このような単純な言語分布は、古代北ユーラシアの実情と合いません。水のことをjak-、jik-、juk-、jek-、jok-のように言っていた言語群も、水のことをam-、um-、om-のように言っていた言語群も、水のことをmark-、mirk-、murk-、merk-、mork-(mar-、mir-、mur-、mer-、mor-、mak-、mik-、muk-、mek-、mok-)のように言っていた言語群も、ヨーロッパ方面と東アジア方面の双方に大きな跡を残しているからです。むしろ、以下のような言語分布になっていたのではないかと考えられるくらいです。

赤い糸、青い糸、黄色い糸があって、それらが複雑に絡み合っているような状態です。少なくとも、古代北ユーラシアの言語分布は先に示したような単純な言語分布ではなかったということです。このことは、人類の言語の歴史、そして一般に人類の歴史を考える際に頭に入れておかなければなりません。上の図の一番左で赤の言語を話している人々のDNAは、すぐそばで青の言語および黄色の言語を話している人々のDNAと比べてどうでしょうか。上の図の一番左で赤の言語を話している人々のDNAは、上の図の一番右で赤の言語を話している人々のDNAと比べてどうでしょうか。

水のことをmark-、mirk-、murk-、merk-、mork-(mar-、mir-、mur-、mer-、mor-、mak-、mik-、muk-、mek-、mok-)のように言っていた言語群に関連する問題は様々ありますが、その中にアイヌ語の起源に関する問題もあります。水のことをmark-、mirk-、murk-、merk-、mork-(mar-、mir-、mur-、mer-、mor-、mak-、mik-、muk-、mek-、mok-)のように言っていた言語群は、朝鮮語の起源だけでなく、アイヌ語の起源とも関係がありそうです。この興味深い話題についてお話しする前に、北ユーラシアの言語の歴史を考えるうえでどうしても外せないので、LとRの話をはさみます。日本人が英語などを学ぶ際によく問題となるLとRの話です。

新潟の「潟(かた)」に隠された歴史

水のことをjak-、jik-、juk-、jek-、jok-のように言っていた言語群、am-、um-、om-のように言っていた言語群、sam-、sim-、sum-、sem-、som-のように言っていた言語群など、かつての日本語の周辺には、全然知られていない言語(もう今では残っていない言語)がたくさんありました。日本語の成り立ちを明らかにするためには、それらの言語を丁寧に掘り起こしていかなければなりません。

向き・方向を意味したsama(様)の語源が「水」であることはお話ししましたが、同じく向き・方向を意味したkata(方)の語源も「水」のようです。日本語のそばに、水のことをkataのように言う言語があったということです。

日本語には、水と関係の深いkata(潟)という語がありました。新潟などの地名に残っています。kata(潟)は、潮が満ちると隠れ、潮が引くと現れる場所(要するに海と陸の境のあたり)を意味することが多かったですが、海から少し陸に入ったところにできる湖を意味することもありました。

水を意味するkataのような語が存在したことは、上記のkata(潟)だけでなく、katasi(かたし)からも窺えます。水を意味できなくなったkataが、氷を意味しようとしたが、それも叶わず、katasi(かたし)になったと見られます。氷を意味していた語が冷たさ・寒さを意味するようになることはよくありますが、かたさを意味するようになることもよくあります。katikati(かちかち)、gatigati(がちがち)、gattiri(がっちり)、gassiri(がっしり)やgatan(がたん)、gatyan(がちゃん)、gatin(がちん)、gatun(がつん)など、同類がたくさんありそうです。

水を意味したkataは、samaと同じように向き・方向も意味するようになりました。向き・方向を意味していたsama(様)が状態を意味するようになった話を思い出してください。kata(方)もなにかが存在する様、そしてさらに、なにかが行われる様を意味するようになりました。こうして、「あり方、開け方、切り方」のような言い方が生まれます。水を意味する語から、方法を意味する語まで生まれるのです。

水を意味したkataは、多様な変化を経験したようです。水・水域を意味していた語が端の部分、境界の部分を意味するようになるのは、お決まりのパターンです。なにかの端の部分(ふち、へり、周縁部)を見てください。そこから「輪郭」のような意味が生まれそうではないでしょうか。これがkata(形)であったと思われます。kataの意味があまりに多様になってきたために、kata(形)からkatati(形)やsugata(姿)を作り出して区別しようとしたのかもしれません。

kataが水・水域に隣接する陸の部分を意味していたのであれば、この図のような状況もあったはずです。二つあるうちの一つを指すkata(片)は、ここから来ていると考えられます。kataɸara(傍)はもともと横腹・脇腹を意味していたので、kataは一方、横、脇などの意味を持っていたのでしょう。これでkatamuku(傾く)やkatayoru(偏る)も納得です。

※インド・ヨーロッパ語族にも、似た例があります。インド・ヨーロッパ語族には、二分されたうちの一方、つまり半分を意味するラテン語semi-や古代ギリシャ語hemi-のような語がありました(英語にもsam-という語がありましたが、廃れてしまいました)。前回の記事でお話しした大テュルク語族で水を意味したsam-、sim-、sum-、sem-、som-のような語と関係がありそうです。

水を意味したkataのような語は、jak-、jik-、juk-、jek-、jok-のような語とも、am-、um-、om-のような語とも、sam-、sim-、sum-、sem-、som-のような語とも明らかに違います。向き・方向を意味するsama(様)の話が出たので、ついでにkata(方)の話をしましたが、水のことをkataのように言う言語群以外にも、様々な言語群が存在したようです。日本語のまわりの言語の分布は非常に複雑だったということです。英語、中国語、ロシア語のような大言語は存在せず、小さな言語がひしめいていた時代の話です。現生人類は3~4万年前には北ユーラシア・東アジアに広く現れていますが、その当時の言語が互いに大きく異なっていた可能性もあります。

過去3~4万年間の北ユーラシア・東アジアの言語の歴史は、簡単には明らかにできません。まず重要なのは、特に有力であった言語群を浮かび上がらせながら、大ざっぱな全体像をつかみにいくことです。

水のことをjak-、jik-、juk-、jek-、jok-のように言う言語群も、am-、um-、om-のように言う言語群も、sam-、sim-、sum-、sem-、som-のように言語群も巨大な言語群だったと考えられますが、これらに全く劣らない別の巨大な言語群が存在したようです。タイミング的にちょうどよいので、この別の巨大な言語群の話をすることにします。この別の巨大な言語群は、色々と謎めいたところのある言語群です。朝鮮語やアイヌ語の起源に関わる話になります。

知られざる大テュルク語族?

水のことをsam-、sim-、sum-、sem-、som-のように言っていた言語群があり、この言語群から日本語に大量の語彙が入ったようだと述べました。水のことをsam-、sim-、sum-、sem-、som-のように言っていた言語群は一体どのような言語群だったのだろうと思いながら日本の周辺を見渡すと、アイヌ語wakka(水)、朝鮮語mul(水)、エヴェンキ語mū(水)ムー、ナナイ語mue(水)ムウ、満州語muke(水)ムク、モンゴル語us(水)などは明らかに違いますが(シベリアに少数民族の言語としてかろうじて残っているケット語ulj(水)ウリ、ユカギール語ōʒī(水)オージー、チュクチ語mimyl(水)ミムル、ニヴフ語tʃaχ(水)チャフなども明らかに違います)、テュルク諸語にはそれらしきところがあります。テュルク諸語では、「水」のことを以下のように言います。

テュルク諸語というのは、非常によく似た言語の集まりです。インド・ヨーロッパ語族の諸言語は大きな違いを見せ、ウラル語族の諸言語も大きな違いを見せますが、テュルク諸語にはそのような大きな違いは見られません。これは、テュルク祖語が比較的近い過去に存在し、そのテュルク祖語が枝分かれしてテュルク諸語ができたことを物語っています。

そんな似たもの同士のテュルク諸語ですが、チュヴァシ語はその語彙全体からして他のテュルク系言語とはやや遠い関係にあると考えられています。チュヴァシ語は、ウラル山脈の南西のあたりで話されています。テュルク諸語を見る時には、「チュヴァシ語」と「その他のテュルク系言語」という見方をする必要があるということです。

テュルク祖語では、水のことをチュヴァシ語şɯvシュヴあるいはウズベク語suvのように言っていたと考えられます。子音vはヨーロッパでは一般的ですが、北ユーラシア全体ではあまり一般的でないので、末尾のvの部分はwかbだったかもしれません。

すでに「心(こころ)」の語源の記事などで、テュルク系言語がかつて東アジア(中国東海岸近く)にも存在し、日本語に影響を与えたと見られることをお話ししました。しかし、ここには大いに考えるべき問題があります。上の表に示したテュルク諸語の「水」を見てください。言語によって語形が少しずつ違いますが、そのバリエーションは乏しいです。このような乏しいバリエーションからは、日本語のsama(様)、samu(冷む)、samu(覚む、醒む)、zabuzabu(ざぶざぶ)、sima(島)、siba(芝)、sumu(澄む)、zubuzubu(ずぶずぶ)、somu(染む)、soba(そば)などの多様な語形は生まれそうにありません。これはどのように考えたらよいのでしょうか。テュルク諸語が非常に似通っていることを考慮すると、以下のようなシナリオが浮上してきます。

(1)かつて水のことをsam-、sim-、sum-、sem-、som-のように言う巨大な言語群が存在した。

(2)この巨大な言語群は日本語との付き合いが深く、日本語に大きな影響を与えた。

(3)この巨大な言語群は激しい生き残り競争の中で大部分が消滅し、一部がテュルク諸語として残った。

こう考えると、つじつまが合います。

※(1)の水のことをsam-、sim-、sum-、sem-、som-のように言っていた巨大な言語群の内部は多様で、mの部分がbになったり、pになったりしていたと見られます。*sapaがsaɸa(沢)(地方によって、「水が浅く溜まって草が生えているところ、湿地」を意味したり、「谷川、渓流」を意味したりします)になったり、*sipoがsiɸo(潮、塩)(潮は海水のこと)になったりしたのでしょう。日本語のsaɸayaka(爽やか)、sappari(さっぱり)、sabasaba(さばさば)は、語源がとてもわかりづらいですが、もともと透明感あるいは清涼感を意味し、「水」から来ているのかもしれません(samu(冷む)、samu(覚む、醒む)、sumu(澄む)、sumiyaka(澄みやか)などが「水」から来ていたことを思い出してください)。濡れていることを意味するsippori(しっぽり)は、「水」から来ているにちがいありません。

テュルク系言語は、モンゴル系言語・ツングース系言語と系統関係があるのではないかというアルタイ語族仮説の一部として論じられることが多かったですが、そうではなく、テュルク系言語は、すでに消滅してしまった言語と大語族を成していた可能性が高いです。テュルク系言語を含む巨大な言語群で水を意味したsam-、sim-、sum-、sem-、som-のような語(場合によってmの部分はb、p、wなど)は、モンゴル系言語・ツングース系言語の「水」(モンゴル語us(水)、エヴェンキ語mū(水)ムー、ナナイ語mue(水)ムウ、満州語muke(水)ムクなど)に似ておらず、むしろシナ・チベット語族の「水」(古代中国語sywij(水)シウイ、ペー語ɕui(水)シュイ、チベット語chu(水)チュ、ガロ語chi(水)、ミゾ語tui(水)など)に似ているぐらいです。もちろん、このようなわずかなデータから確かなことは言えませんが、テュルク系言語はモンゴル系言語・ツングース系言語とは大きく隔たっていそうです。

※水を意味していた語が水以外の液体(血、汗、涙、唾液、尿などを含めて)を意味するようになるケースは非常に多く、シナ・チベット語族の言語で水を意味していた語が日本語のti(血)になった可能性があります。三省堂時代別国語大辞典上代編(上代語辞典編修委員会1967)では、奈良時代の日本語にti(血)のほかにtu(血)という形が見られたことを指摘していますが、ti(血)もtu(血)もシナ・チベット語族の語形とよく合います。

歴史言語学の歩みを振り返ってみると、アルタイ語族仮説などが典型的ですが、現在残っている言語同士を結びつけようと焦りすぎた感があります。消滅した言語についての考察が欠けていたのです。消滅した言語について考察することは不可能なのかというと、そんなことはありません。消滅した言語は、生き残る言語に大量または少量の語彙を与えて消滅していったのです。したがって、現在残っている言語を隅々まで調べることによって、消滅した言語について考察することがある程度可能です。消滅した言語について考察する作業は、この後ますます重要になってきます。

 

参考文献

上代語辞典編修委員会、「時代別国語大辞典 上代編」、三省堂、1967年。