現代人あるいは現代の言語学者が陥りがちな考え<更新版>

前回の記事では、「言語は存続しながらその話者集団のDNAがすっかり入れ替わってしまうのはなぜか」という問いを立てました。

この問いは、人類の歴史を考えるうえで非常に重要な問いですが、現代人にとってはなかなか考えづらい問いです。

例えば、現代の日本を考えればよくわかると思いますが、巨大な日本語の話者集団が存在し、国家による大規模な国境管理によって、内から外および外から内への移動が容易に起きないようになっています。観光旅行のようなごく一時的な移動を除けば、移動はほとんど起きないようになっていると言っても過言ではありません。

言ってみれば、言語とDNAのペアが人為によって強力に固定され、ずっと維持されている状態です。

このような状態が生じたのは、人類の歴史の中でごく最近のことです。しかし、現代人は生まれた時からこの状態の中に身を置いているので、それとは違う昔の状態のことがなかなか考えられないのです。

日本語の歴史を考えるうえで参考になるので、ハンガリー語の話者集団とトルコ語の話者集団に目を向けてみましょう。本ブログで何度も取り上げている言語ですが、ハンガリー語はウラル語族の言語の一つで、トルコ語はテュルク諸語の一つです。ウラル語族もテュルク諸語も分布域がとても広いですが、ウラル語族の中で一番西まで行ったのがハンガリー語で、テュルク諸語の中で一番西まで行ったのがトルコ語です。

当然、ハンガリー語の話者集団もトルコ語の話者集団も他の言語を話していた人々をどんどん取り込んでいったんだろうなと予想されるわけですが、案の定、ハンガリー語の話者集団のDNAもトルコ語の話者集団のDNAも激変しています(Yunusbayev 2015、Tambets 2018)。

Yunusbayev 2015では、テュルク諸語の話者のゲノム(DNA全体)を調べています。中央アジアのウズベク語、カザフ語、キルギス語などの話者のDNAは東アジア(モンゴル、中国、朝鮮、日本)の人々との共通部分をかなり持っていますが、トルコ語の話者のDNAは東アジアの人々との共通部分をわずかしか持っていません。

Tambets 2018では、ウラル語族の話者のゲノム(DNA全体)を調べています。ウラル語族の話者のDNAは東アジアの人々との共通部分をほとんど持っておらず、先ほどのトルコ語の話者が見せるレベルよりももっと低いくらいです。ただ、ハンガリー語を除くウラル語族の話者は、古代の遼河流域で支配的だったY染色体DNAのN系統を高い率で示し、この点が特異です。ハンガリー語の話者は、Y染色体DNAのN系統すらほとんど見られず、およそ東アジアとのつながりが見えない状態です。

このように、ハンガリー語の話者集団のDNAとトルコ語の話者集団のDNAは激変しているのですが、ハンガリー語がウラル語族の言語の一つとして、トルコ語がテュルク諸語の一つとして今日まで存続していることは動かぬ事実です。意外ではありますが、なぜこのようになるのか考えなければなりません。

この問題は、日本語にも無関係ではありません。前回の記事でお話ししたように、遼河流域→山東省→朝鮮半島→日本列島という日本語の歴史を説明しようとすると、なぜ日本語(正確には「日本語の前身言語」と言うべきですが、以下では単に「日本語」と言います)の話者集団のY染色体DNAが遼河流域→山東省の途上でNからO-M122とO-M176に入れ替わったのか説明しなければならないからです。

参考のためにハンガリー語とトルコ語の例を先に挙げましたが、ハンガリー語とトルコ語のケースと、日本語のケースでは、ちょっと違うところもあります。それは、ハンガリー語とトルコ語の話者集団では、ミトコンドリアDNA、Y染色体DNA、ゲノム(DNA全体)のすべてが激変したが、日本語の話者集団では、Y染色体DNAは激変したが、ミトコンドリアDNAとゲノム(DNA全体)は激変しなかったと見られる点です。

Zhang 2017では、古代の遼河流域と黄河流域の間の地域に住んでいた人間集団のミトコンドリアDNAとY染色体DNAを調べています。Y染色体DNAに関しては、遼河方面はN系統、黄河方面はO系統という傾向がはっきり認められますが、ミトコンドリアDNAに関しては、遼河方面にも多様なミトコンドリアDNA、黄河方面にも多様なミトコンドリアDNAが存在し、これらのバリエーションの間には共通要素が多いです。Y染色体DNAの分布が分かれているようには、ミトコンドリアDNAの分布は分かれていないわけです。

これだと、遼河流域から山東省に向かった日本語の話者集団のY染色体DNAが激変することはあっても、ミトコンドリアDNAが激変することはなさそうです。

東アジア・東南アジアの人間集団のゲノム(DNA全体)は、すでによく調べられており、その大雑把な構図は以下のようになっています。以下は、Yang 2020からの引用ですが、他の研究でも同様です。

Mongolic—モンゴル系言語の話者、Tungusic—ツングース系言語の話者、Japonic—日本語の話者、Koreanic—朝鮮語の話者、Han—中国語の話者、Austronesian—オーストロネシア語族の話者、Kra-Dai—タイ系言語の話者、Austroasiatic—ベトナム系言語の話者、Tibeto-Burman—チベット・ビルマ系言語の話者

灰色で示されているのが、現代人のデータです。一方の極に、モンゴル系言語とツングース系言語の話者がおり、他方の極に、オーストロネシア語族、タイ系言語、ベトナム系言語の話者がいます。中国は広いので、中国語の話者は、一方の極に近い人から他方の極に近い人までいます。日本語と朝鮮語の話者は、モンゴル系言語/ツングース系言語の話者と中国語の話者の間のあたりに現れます。

※上の図では、ツングース系言語の話者とオーストロネシア語族の話者が非常に広く散らばっていますが、そもそもツングース系言語とオーストロネシア語族の分布範囲がとても広いです。もう今は存在しない、ツングース系言語と全然違う言語の話者がツングース系言語に乗り換えたり、もう今は存在しない、オーストロネシア語族と全然違う言語の話者がオーストロネシア語族に乗り換えたりしたと見られます。

遼河流域で農耕を行っていた人々と黄河流域で農耕を行っていた人々は、Y染色体DNAではNとOというはっきりした違いを示すものの、ミトコンドリアDNAは近く(Zhang 2017)、ゲノム(DNA全体)も近いです(Ning 2020)。日本語の話者集団が遼河流域から山東省に移動する過程で、Y染色体DNAは激変したが、ミトコンドリアDNAとゲノム(DNA全体)は激変せず、Y染色体DNAがどのようにNからO-M122とO-M176に入れ替わったかが説明できれば、話は済みそうです。

日本語の話者集団は、先ほどのハンガリー語とトルコ語の話者集団のように激変したわけではないということです。日本語の移動距離はハンガリー語とトルコ語の移動距離ほど長くないので、これは納得です。

筆者は、日本語の話者集団のY染色体DNAがNからO-M122とO-M176に変わっていく過程は、以下のようなものだったのではないかと考えています。

DNAの話より単純なので、液体の話に喩えてみましょう。

左側の容器には赤い液体が少し入っています。右側の容器には青い液体が大量に入っています。

右側の容器の青い液体を左側の容器に一気に注いだらどうなるでしょうか。左側の容器の液体はほぼ青になるでしょう。

では、右側の容器の青い液体を長い年数をかけて徐々に左側の容器に注いだらどうなるでしょうか。やはり、左側の容器の液体はほぼ青になるでしょう。

ここで、赤い液体をY染色体DNAのN系統を持つ人間集団に、青い液体をY染色体DNAのO系統を持つ人間集団に置き換えて考えてください。

前回の記事でお話ししたように、遼河流域から山東省へ南下していった日本語の話者集団は、気候変化によって遼河流域でアワとキビの栽培が今までのように行えなくなり、南下していったと考えられる集団です。

5000年前頃から気候が悪化し、遼河流域の人口はどんどん減り、4200~4000年前頃にどん底まで落ちます。遼河流域から南下していった日本語の話者集団は、あまり人数が多くなかったでしょう。

南側は、Y染色体DNAのO系統を持つ人間集団が暮らしている地域です。日本語の話者集団がそこを突き進む限り、もう外からN系統のY染色体DNAが入ってくることはありません。N系統の人間集団がO系統の人間集団に取り囲まれるような状況です。そのような状況の中で、N系統の人間集団の言語はどのように残ったのでしょうか。

日本語を見てまず思うのは、ウラル語族、テュルク諸語、モンゴル諸語、ツングース諸語などの北方の言語の文法構造を非常によく残しているということです(フィンランド語やハンガリー語は、全然違う言語を話す人々が住むヨーロッパに突入していったので、文法が完全に変わってしまいましたが、ウラル語族の言語は、北極地方のサモエード諸語からわかるように、もともとテュルク諸語、モンゴル諸語、ツングース諸語などに似た文法を持っていました。現在では、そのサモエード諸語の文法もロシア語の影響を受けて変わりつつありますが)。

もし日本語の話者集団に、他言語の話者が大量かつ急激に入ってきたら、日本語は消滅するか、文法が大きく変わるかしたはずです。中国語がよい例です。中国語だけを見てもわからないのですが、シナ・チベット語族の他の言語を見ると、中国語の文法が大きく変わっているのがわかります。明らかに、他言語の話者が大量かつ急激に入ってきた歴史を持っています。特に、タイ系言語やベトナム系言語の話者の存在を思わせます。日本語は、文法に関しては、そういうところがないのです。タイ系言語やベトナム系言語の語彙は入っていますが、文法は崩れていないのです。

遼河流域から山東省に南下した日本語の話者集団は、他言語の話者を大量に取り込んだが、それはおそらく武力によるものではなく、上の赤い液体に青い液体が徐々に注がれていくような穏やかでありながら継続的なプロセスだったと見られます。これだと、外から少しずつ人が入ってきますが、常に古参者が新参者より多いので、文法がよく保たれるのです。

遼河流域から南下していく日本語の話者集団に外から少しずつ人が入ってくる状況を考えるわけですが、そのためには、当時の遼河流域とそれより南の地域の状況を考えなければなりません。

すでに述べたように、5000年前頃から気候が悪化し、遼河流域の人口はどんどん減り、4200~4000年前頃にどん底に落ちます。今までのようにアワとキビの栽培を行えなくなった少人数の人々が、遼河流域から南下し始めます。

ここで重要なのは、気候の悪化によって、遼河流域の農耕は極めて深刻な被害を受けたが、南の地域の農耕もかなり深刻な被害を受けていたということです。山東省では、山東龍山文化の時代(4600~3900年前頃)にイネの栽培が盛んに行われましたが、それは山東龍山文化の時代の前期~中期の話であり、晩期にはイネの栽培は著しく衰えていました(Gao 2009)。遼河流域は極めて深刻な人口減少に見舞われたが、南の地域もかなり深刻な人口減少に見舞われていたということです。

遼河流域から南下してきた少人数の人々の言語(つまり日本語)が生き残れたのは、南の地域でも人口が減少していたからだと考えられます。この時に南の地域に大集団が話す大言語が存在していたら、日本語は消滅してしまったかもしれません。しかし実際には、南の地域は閑散としており、小集団が話す小言語が存在するだけだったのです。

Zhang 2017は、古代の遼河流域と黄河流域の間の地域のY染色体DNAを調べた貴重な研究ですが、そこでは当初はNが支配的で、のちにO-M122が支配的になったことが明らかになっています。ここにO-M176が見られないことも、注目に値します。

現代の日本人にY染色体DNAのN系統がほとんど見られないことを思い出しましょう。おそらく、遼河流域から南下し始めた日本語の話者集団では、Nが支配的だったが、このもとの集団はとても小さい集団であり、南下するにしたがって外から徐々に入ってくるO-M122が支配的になるのは、時間の問題だったと見られます。日本語の話者集団は、Nが支配的な集団からまずはO-M122が支配的な集団に変わったということです。これが起こりえたのは、Nが支配的なもとの集団がとても小さい集団だったからです。

これに対して、O-M122が徐々に入ってくることによって新しく形成されたO-M122が支配的な日本語の話者集団は、もう小さい集団ではなかったと見られます。O-M122が支配的なもう小さくない集団に、さらに南のO-M176がどんどん入ってきても、O-M122は消えません。単純に示すと、日本語の話者集団のY染色体DNAは、以下のように変化したということです。

これが、現代の日本語の話者にO-M122とO-M176が多く見られ、Nがほとんど見られない理由と考えられます。現代の朝鮮語の話者についても、同様です。

ただし、細かいことを言うと、日本語の話者と朝鮮語の話者には少し違いもあります。朝鮮語の話者ではO-M122がO-M176より多いが、日本語の話者ではO-M176がO-M122より多いという点です(Nonaka 2007、Kim 2010)。前者でも、後者でも、大差ではありませんが、確かな差があります。

パズルの最後の1ピースを探し求めて、注目される山東省のDNAのデータの記事でお話ししたように、現時点では古代の黄河下流域のY染色体DNAのデータがまだ発表されていないので、確実な判断は下せませんが、なぜ現代の日本語の話者集団でO-M176がO-M122より多くなっているのか考察する必要があります。

東アジアの運命を決定した三つ巴、二里頭文化と下七垣文化と岳石文化の記事から説明してきたように、日本語の話者集団は、殷が西から山東省に侵攻した時に、朝鮮半島に逃れたと考えられます。この殷の侵攻は大規模なものであり、日本語の話者集団だけでなく、その他の様々な言語の話者集団も、山東省から朝鮮半島に逃れたはずです。日本語の話者集団のY染色体DNAについては、山東省にいる時点ですでにO-M176がO-M122より多かったのか、朝鮮半島に移った後でO-M176がO-M122より多くなったのか、今のところ不明です。

日本語の話者集団が山東省から朝鮮半島に移動し、朝鮮半島から日本列島に移動するところを考えてください。日本列島に入ってきた日本語の話者集団は、朝鮮半島全体というより、朝鮮半島の西海岸地域~南海岸地域との関係が深いのです。このことは、考古学者の端野晋平氏が朝鮮半島と日本列島の住居や道具を詳しく研究し、鮮やかに示しています(以下は端野2014からの引用で、住居の研究の一端です)。

日本語の話者集団のY染色体DNAは山東省にいる時点ですでにO-M176がO-M122より多かったのか、それとも、朝鮮半島に移った後でO-M176がO-M122より多くなったのかという問題については、古代の黄河下流域のY染色体DNAのデータが発表されるのを待たなければならないでしょう。古代の山東省に北ではO-M122が多く、南ではO-M176が多いという傾向があって、同じように、古代の朝鮮半島に北ではO-M122が多く、南ではO-M176が多いという傾向があったのかもしれません。

このO-M176とO-M122の問題も、近い将来に明らかになるでしょう。生物学(遺伝学)と考古学の発展には、目を見張るものがあります。

これに対して、相変わらず進歩していないのが(歴史)言語学です。最後に、現代人あるいは現代の言語学者が陥りがちな考えをすばりと指摘したいので、本ブログでよく引用しているRobbeets 2021の図をもう一度示します。

Robbeets 2021の研究は、これまで注目されてこなかった遼河流域に注目を集めたという点で、価値ある研究です。同研究が示している生物学(遺伝学)と考古学のデータも貴重だと思います。しかし、言語の歴史(正確には言語の系統)に関する考察が無茶苦茶です。

上の図を見るとよくわかりますが、同じ系統の言語が集まって広く分布していたと考えています(Transeurasian(トランスユーラシア系)、Sino-Tibetan(シナ・チベット系)、Ainuic(アイヌ系)と書かれているのがそうです)。

これがまず全然違います。中東発あるいは中国発の文明が最後まで届かなかったオーストラリア(アボリジニ)、パプアニューギニア、アメリカ大陸(インディアン)を見ると、とてつもない数の言語、どころではなく、とてつもない数の語族が出てきます。これが昔の状態なのです。ユーラシア大陸にいた人々のごく一部がオーストラリア、パプアニューギニア、アメリカ大陸に進んだわけですから、ユーラシア大陸の言語事情がオーストラリア、パプアニューギニア、アメリカ大陸の言語事情より複雑だったことは確実です。

なぜ上の図のような考えに陥るかというと、人々が巨大な固まり(集団)を作って外部の者を拒絶するという現代の国家のようなものを考えてしまっているからです。

今から数万年前に、互いに明らかに異なる四つの言語があったとしましょう。

赤の言語、青の言語、黄の言語、緑の言語があります。それぞれの言語は、すぐにいくつもの方言、やがていくつもの言語に分化していきます。赤の言語から生じる言語の分布、青の言語から生じる言語の分布、黄の言語から生じる言語の分布、緑の言語から生じる言語の分布はどうなるでしょうか。

以下のようになるだろうというのが、Robbeets氏らの考えです。

それに対して、以下のようになるだろうというのが、筆者の考えです。

筆者の考えは、一見奇抜に見えるかもしれません。しかし、巨大な容器の中に、いくつかの赤の玉を一箇所に集めて配置、いくつかの青の球を一箇所に集めて配置、いくつかの黄の玉を一箇所に集めて配置、いくつかの緑の玉を一箇所に集めて配置してください。容器にふたをし、容器をしばらく揺さぶってみましょう。その後ふたを開けた時、赤、青、黄、緑の玉の配置はどのようになっているでしょうか。一番目の図のようになっているでしょうか、それとも、二番目の図のようになっているでしょうか。

現代の国家のようなものがなければ、まして定住傾向が弱ければ、筆者がここで述べていることは当たり前のように起きることなのです。筆者は、勝手に想像しながらこのように語っているわけではありません。

例えば、前に取り上げましたが、英語のmark(印)(かつては境を意味していました)という語があります。フィンランド語のmärkä(濡れている)マルカという語もあります。英語が話されているあたりやフィンランド語が話されているあたりに、水のことをmark-のように言う人たちがいたことがわかります。

この水を意味するmark-のような語と関係があると見られる語は、ユーラシアの様々な場所に見られます。バイカル湖の近くから北極海まで流れる巨大なLena River(レナ川)の支流にMarkha River(マルハ川)があります。バイカル湖に注ぐBarguzin River(バルグジン川)もあります。中央アジア最大の湖であるLake Balkhash(バルハシ湖)もあります。朝鮮語のmakta(清い、澄んでいる、透き通っている)は、組み込まれたmalg-という形を見せ、間違いなく「水」から来ています。朝鮮語のそばに水のことをそのように言う言語があったということです。アイヌ語のwakka(水)の古形が*warkaか*walkaと考えられることはすでにお話ししました。

水を意味するmark-、bark-、wark-(malk-、balk-、walk-)のような語がユーラシアに散らばっていたのです(母音が変化したり、子音が脱落したりしていますが、朝鮮語mul(水)やツングース諸語のエヴェンキ語mū(水)、ナナイ語muə(水)ムウ、満州語mukə(水)ムク(水)なども同源です)。

その一方で、北ユーラシアには、水のことをmark-、bark-、wark-(malk-、balk-、walk-)のように言わない言語もたくさんあります。

Robbeets氏らが考えるような一番目の図ではなく、筆者が考えるような二番目の図が、人類の言語の歴史に近いのです。

二番目の図で、赤の言語同士は文法が近いかというと、全くそんなことはありません。青の言語同士も、黄の言語同士も、緑の言語同士も、そうです。赤の言語か、青の言語か、黄の言語か、緑の言語かに関係なく、近いところにある言語同士は近い文法・語法を持っています。日頃から一語一語変換してコミュニケーションを取っている、あるいは取ろうとしているからです。文法書や辞書がない時代には、これ以外にやりようがありません。

例えば、二番目の図の左上隅を見てください。赤の言語、青の言語、黄の言語、緑の言語が隣接しています。この赤の言語、青の言語、黄の言語、緑の言語は、文法が似ています。この赤の言語、青の言語、黄の言語、緑の言語は、共通語彙をたくさん持っています(それぞれの語の出所がどこかはともかく)。隣接していたら、話者のDNAも話者の文化も近いかもしれません。ここから、「左上隅の赤の言語、青の言語、黄の言語、緑の言語は同系統にちがいない」という早とちりの結論が出されしまうのです。

逆に、左上隅の赤の言語と右下隅の赤の言語を比べたらどうでしょうか。遠い遠い昔に分かれた同系統の言語です。上の記述とは全く逆になります。すなわち、文法が似ていない、共通語彙をほとんど持っていない、話者のDNAが近くない、話者の文化が近くない、そうなるのです。

でも、これが言語の系統関係なのです。

ここまでのいくつかの記事を読んで、DNAの話、言語の話、稲作の話が単純に結びつかないことがおわかりいただけたと思います。日本人に関して言えば、日本語は遼河流域から来ている、稲作は長江流域から来ている、DNAは主にそれらの間の地域から来ているようなのです。

※従来の日本語の起源をめぐる議論で、日本語に北方の要素と南方の要素が認められると指摘されてきたのは、正しいです。しかし、二言語が混合して日本語が生じたかのような記述は、正しくありません。日本語が存在していたのは、無数の小さな言語がひしめく空間であり、二つの言語がまわりのすべての言語から隔離され、その二つの言語の間でのみ相互作用が起きるということはありえません。

 

参考文献

日本語

端野晋平、「渡来文化の形成とその背景」、古代学協会編/下條信行監修『列島初期稲作の担い手は誰か』、すいれん舎、2014年。

英語

Kim H. et al. 2010. Y chromosome homogeneity in the Korean population. International Journal of Legal Medicine 124(6): 653-657.

Ning C. et al. 2020. Ancient genomes from northern China suggest links between subsistence changes and human migration. Nature Communications 11: 2700.

Nonaka I. et al. 2007. Y-chromosomal binary haplogroups in the Japanese population and their relationship to 16 Y-STR polymorphisms. Annals of Human Genetics 71(4): 480-495.

Robbeets M. et al. 2021. Triangulation supports agricultural spread of the Transeurasian languages. Nature 599(7886): 616-621.

Tambets K. et al. 2018. Genes reveal traces of common recent demographic history for most of the Uralic-speaking populations. Genome Biology 19(1): 139.

Yang M. A. et al. 2020. Ancient DNA indicates human population shifts and admixture in northern and southern China. Science 369(6501): 282-288.

Yunusbayev B. et al. 2015. The genetic legacy of the expansion of Turkic-speaking nomads across Eurasia. PLoS Genetics 11(4): e1005068.

Zhang Y. et al. 2017. Genetic diversity of two Neolithic populations provides evidence of farming expansions in North China. Journal of Human Genetics 62(2): 199-204.

その他の言語

Gao, J. et al. 2009. 岳石文化时期海岱文化区人文地理格局演变探析. 考古 11: 48-58.(中国語)