东亚人类分布(下)
四.东亚人主体的父系远祖——O人群 东亚真正的主体是NO人群。 NO是K的一个分支,大致在3.5万年前进入,并在3万年前左右分化成N和O两个姊妹类型。 NO到达东亚时,东亚地区已经为C3所占据,但NO类型在很短时期内就成功的取代了C3,成为了东亚的主人。 NO是最原始NO原始人群的类型,出现在以下人群中:达斡尔族2.6%、鄂温克族3.82%、赫哲族2.2%、**2.9%,华北汉族2.3%,华南汉族2.5%,越南人3.1%,外蒙古人0.7%、布依族5.7%、日本人2.1%、韩国人2.3%、彝族人2.3%,Bama瑶族2.9%。 N、O的分布在黄种人差异巨大。对东亚黄种人而言,O比N多得多,而对北亚黄种人而言,只有N而无O,对于泰国以南的黄种人而言,只有O而无N。 O类型分为很多类型,主要有O*、O1、O2*、O2a、O2b、O3等。 O*在是O的原始类型,在东亚只是零星的低频率找到,比如Hammer和XUE的数据中,共有以下民族中找到过最古老的O*:满族5.8%、壮族5.0%、外蒙古人0.7%、藏族1.0%、达斡尔族2.6%、鄂伦春族3.2%、兰州汉族2.9%、黎族5.7%,在luchuncheng在2007年的论文中,在800个江苏汉族中,找到11个O*,比例为1.4%。在马明义2007年的数据中,341四川汉族中找到4个古老的O*,出现频率为1.2%。 NO和O*两个古老的类型发现频率都很低,而其他的O类型也比较常见,下面一一介绍。 O1根据李辉2007年研究,是良渚文化的主体类型,同时,根据金力李辉的数据,河北磁山文化的主体也是O1,同时红山文化中也存在部分O1。 O1今天汉族中的分布如下:在luchuncheng在2007年的论文中,在800个江苏汉族中139个O1,占17.4%,体现了良渚文化对现代江浙人仍然有很大影响,虽然主体已经变为龙山系统的O3。在马明义2007年的数据中四川汉族10.9%(341人中的37人),复旦2002年的数据为北方汉族1054人有36人,频率3.4%,南方汉族652人有100人,频率为15.3%,Hammer的数据,168个汉族(44个北方,124个南方人)有16人,频率9.5%。ToruKatoh的辽宁汉族为4.8%,ZhouRuixia的2007年数据,甘肃汉族为3.4%(3/87),李辉2007年闽越一文中,195个福建汉族(南澳30、莆田36、汕头68、潮州22、闽南37、闽东2)共找到13个O1,比例6.7%,同一论文中河南安阳为4%(2人/50人)。 总体上看,汉族北方地区大致只有5%以下的O1,而南方地区一般有10%以上的O1,显示了古代良渚文化队华北汉族的血统影响很小,而对南方汉族却有一定的影响,尤其是对长江下游地区。 2003年福建长汀的148个客家人中只发现4个O1,比例只有2.7%,却找到110个O3,比例达到74.3%,客家人O1明显比周边南方汉族低,却和北方汉族高度一致,不但显示了客家汉族父系血统起源的北方特征,也从一个方面证明了古代时期的北方汉族和现代的北方汉族是一致的,的确没有太多的O1成分。 汉族以外的东亚地区,O1的比例如下:(Spencer,2001)东干人5.0%、吉尔吉斯人5.8%、外蒙古4.2%、韩国人4.4%,(karafet,2001)韩国2.7%、满族3.8%、鄂温克族2.4%、宁夏**1.9%,(ToruKatoh,2004)满族3.0%、韩国人2.4%、日本人2.6%,(石宏,2006)白族6%、基诺族4.4%、傈僳族6.1%、壮族4.2%、布依族4.3%、土家族7.4%、普米族4.2%,(Hammer,2006)台湾原住民89.6%、土家族8.2%、苗族6.9%、瑶族1.7%、越南5.7%、壮族10%、马来西亚6.13%、菲律宾10.4%、东部印尼12.9%、西部印尼20.0%,(Xue,2006)**8.5%、达斡尔族5.1%、鄂温克族7.7%、锡伯族7.3%、满族2.9%、黎族26.5%、羌族15.2%、畲族14.7%,Bama瑶族2.9%,Liannan瑶族5.7%,(ZhouRuixia,2007)藏族7.9%。 总体上看,O1最高频率出现在马来语居民中,台湾土著最高,其次为中国华南地区的各民族,如黎族、土家族、羌族、畲族等。东北的一些少数民族也有比较多的数量,显示O1曾经分布在从华南到华北再到东北地区的广阔地区,但华北地区的O1则在后来O3崛起后消失了,华南和东北地区的则保留了。 O2*是扣除O2a和O2b的原始型O2,在东亚也有比较多的分布。 O2*分布在以下人群中(karafet,2001):华北汉族4.5%、宁夏**3.7%、韩国人1.7%、满族人5.8%、鄂温克族4.9%、鄂伦春族4.5%、台湾汉族7.1%、土家族4.1%、彝族2.3%、瑶族20.0%、外蒙古人1.3%,(Xue,2006)**2.9%,赫哲族2.2%,达斡尔族2.6%、满族8.6%、内蒙古人2.2%、鄂伦春族6.5%,哈尔滨汉族8.6%、伊犁汉族9.4%、延边朝鲜4.0%、羌族2.9%、黎族2.8%、bama瑶族37.1%、外蒙古人1.5%。 综合看,东亚人中,华南的瑶族人两组数据,一个37.1%一个20.0%,比例都很高,其他民族都很低,但东北地区也有比较高的比例,显示O2*最初可能是连在一起的,但中部被一个其他人群割断了,推测可能是龙山文化(O3)的崛起取代了O2*,造成了O2的隔断。 O2a,是O2的最大的一个支系,高频率的出现在东南亚地区,尤其壮侗语(Daic)居民中。 2007年李辉的史前长江一文显示,江西吴城文化中,O2a是主体成分,今天,O2a也是主要分布在长江以南的汉族之中。 O2a在汉族中,主要出现在南方,如文波2006年的数据中,甘肃汉族1/60、河南汉族0/50、辽宁汉族1/48、内蒙汉族1/60、山东汉族2/185、陕西汉族1/90、安徽汉族0/22、湖北汉族0/18、江苏汉族4/100,总体上长江之北的北方汉族为9/633,只有1.5%,复旦2002年的数据,北方汉族1053人中13人为O2a,比例为1.35。总体看,O2a在北方汉族大致也就是1%的比例而已。而长江之南的汉族中O2a则非常高的频率,如2006年数据中,浙江5/106、上海汉族0/55、江西1/21、福建长汀客家4/148、广东汉族12/64、广西汉族7/26、湖南汉族2/15、四川8/63、云南汉族3/93,591人中发现42例子,比例7.1%,而复旦2002年的数据中,南方汉族,652人中发现47人,为7.2%,两者比例十分接近,可以说,大致长江之南O2a也就7%,只有广东18.8%,广西26.9%偏高,,扣除两广之后的南方汉族,文的文章中O2a大致为4.6%(29/501),这个比例显然与北方汉族是十分接近的,显示了除了两广外,汉族内部成分的高度一致性。 汉族之外,O2a高度集中在南部壮侗语居民和周边民族中,如复旦2002年数据中,壮族10/28,泰国13/20、高棉族9/26,又如董永利2004年的数据,傣族44/112、壮族18/47、水族8/40、布朗族14/28、傈僳族20/49、纳西族19/40、布依族28/48,XUE的数据里,布依族19/35、哈尼族17/34、黎族21/34,2006年石宏彝族中的僰人为16/32。Han—junJin的数据,越南为5/50、泰国为26/55、印尼人为10/36、菲律宾为1/77。 O2a在北方民族中较少出现,只有达斡尔族是例外,比例高达6/39,鄂温克族也有O2a,XUE数据为3.8%(1/26)、Hammer数据为2.4%(1/41)。石宏的僰人一文,289个藏族中有4个O2a,和北部汉族的比例很接近。大致长江以北,O2a很少(除达斡尔、鄂温克族)。 有观点说日本人中存在大量从东南亚北上的南岛语人口,甚至网络上有说法日本天皇家族的成员检测为O2a,我认为这个不太可能,日本人中O2a很少见。Xue的数据里日本为2/47、Hammer的数据日本为5/259,Han—junJin的数据为1/108、Nonaka的数据8/729,总体上,为16/1143,比例非常小的,不太可能有大量南岛人参与了日本人的形成。 O2b是东亚人又一常见类型,在东亚地区主要分布在日本和韩国,但在东南亚,则有更广阔的分布。 (XUE的数据,2006):日本13/47、韩国12/43、延边朝鲜族7/25、锡伯族1/41、满族2/35、赫哲族2/41、达斡尔族1/39,(Hammer的数据,2006):日本29.5%(76/259)、满族3.8%(2/52)、韩国36%(27/75)、越南4.3%(3/70)、印尼16%(4/25),Han—junJin的数据:日本25.9%(28/108)、朝鲜19.4%(31/160)、印尼19.5%(7/36)、菲律宾1.3%(1/70)、越南14%(7/50)、泰国5.4%(3/55),总体看,在日韩和东南亚地区,O2b分布很广,在汉藏语居民中,O2b基本是没有的,在阿尔泰语系中,主要分布在东北地区,蒙古和突厥语地区基本没有。 O3是东亚的主人,也是汉族的主体。 根据2007年研究,山西陶寺遗址的龙山文化居民中,上层贵族100%为O3类型,而根据2008年金力李辉的数据,陕西仰韶文化的居民的Y染色体SNP类型也是O3,所以,我们可以清晰的看出,古代中原居民,尤其是贵族,都是O3占有绝对主体的,仰韶文化和龙山文化居民的Y染色体成分是基本相同的,种族上是同一成分。 O3是汉族的绝对主体,占据非常重要的位置,根据2004年文波的数据,山东汉族为59.5%(110/185)、河南52%(26/50)、陕西汉族56.7%(51/90)、云南汉族63.4%(59/93)、广东汉族53.9%(34/64)、四川汉族57.1%(36/63)、浙江汉族是50.9%(54/106),张咏莉2002年福建汉族的为58.8%(47/80),2006年Hammer的数据北方汉族65.9%(29/44)、台湾汉族49/84(58.3%)(注意这个数据和张咏莉2002年福建汉族的58.8数据几乎一样,类似的还有Nonaka的台湾汉族,183个里106个O3,比例58.2%,福建闽南汉族和台湾汉族数据高度一致),XUE的2006年数据,哈尔滨汉族O3频率是68.6%(23/35),Luchuncheng的数据中南京汉族为53.6%(429/800)、马明义的数据中四川汉族61.8%(211/341)2007年Zhouruixia的数据,甘肃71.3%(62/87),所有数据中,除了河北人83.3%(10/12)由于样本太少外,目前看到的O3出现最高比例的汉族人群是客家人,根据2003年李辉的数据显示,福建长汀客家人中O3的比例高达74.3%(110/148),还有一个类似的数据,是2002年李辉在《广西六甲人来源》一文中的数据,为77.8%,(21人/27人)。 总体上看,所有汉族中,O3都是主体的,不同的取样可能造成数据有波动,但总体出现频率大部分一般在50-70%之间,虽然幅员辽阔人口众多,但汉族内部却表现出了惊人的一致,显示了汉族的共同起源。 今天10亿汉族的绝大多数,都是5000年前中原原始居民的直系后代。主体是仰韶文化和龙山文化的O3(两种文化居民的父系成分相同),O3也就是来自中原仰韶文化和龙山文化的居民构成了各地汉族父系远祖的压倒性绝对多数,其次是河北的磁山文化的O1,红山文化的O3、O2和O1,和良渚文化的O1,其次还有湖北大溪文化和江西吴城文化的O2a,今天广阔的中国土地,仍然为5000年前中国远古土著居民的子孙所占据。 汉族的平话人群是汉族唯一的例外,其O2a超过O3而占主体,与其他汉族不同。 东亚其他民族中,O3也非常常见,这并不等于说这些民族中有汉族血统,因为O3至少在1万年前就扩散到了整个东亚,他们就是这些远古人的后代,而非后来中原统一崛起的汉族带去的。 其他汉藏语居民:spencer2001年数据,东干族40%(16/40),zerjal数据2002年:土家族52.8%(26/49),董永利的数据55.8%(38/68),和汉族非常接近,实际很多汉藏语居民都和汉族接近,又如白族2004年董永利数据为50%(25/50),而2004年文波的数据为50.8%(31/61),白族和土家族可能和汉族有非常紧密的民族起源关系。而其他汉藏语民族和汉族关系要相对远些,如XUE的数据:羌族30.3%(10/33),藏族40%(14/35)、布依族31.4%(11/35),如董永利2004的数据:哈尼族17/41、景颇族4/17、彝族12/41、纳西族1/41、布依族2/48(和XUE的数据显著不同)、普米族4/47。 中国境内其他民族的数据还有:傣族21/112、黎族1/31、壮族8/28。 在东亚的其他地区,如日本韩国,2006年hammer数据日本为20.2%(52/259),韩国为40%(30/75),ToruKatoh的数据,延边朝鲜29.1%(23/79)、韩国34.1%(29/85)、日本16.2%(19/117),XUE的数据:延边朝鲜40%(10/25)、韩国17/43(39.5%),Nonaka的数据韩国为44.5%(117/317),wookkim的数据韩国47.2%(102/216),总体上看,韩国O3比例大致在40%以上,为第一大类型,日本大致在20%,在日本O3比O2b少。 在阿尔泰语系中,东北地区满语族人O3比例非常高,为满族、锡伯族、赫哲族的第一大类型。在蒙古族人群中,内蒙和喀尔喀外蒙人最高,大致在20-30%之间,西部蒙古O3非常少,基本都在5%以下或者根本没有。西伯利亚地区没有O3的分布。突厥语人中,O3不高,但分布很广,最高为裕固族和撒拉族,大致30-40%,维族大致10%,越向西则越来越少,哈萨克族大致在10%,乌兹别克大致2%、而到了土耳其地区,523个土耳其人只有一个O3,只占0.2%。 O3占各阿尔泰语人群的具体数据如下: 满语族:UE数据:满族37.1%(13/35),Hammer数据满族38.5%(20/52)、ToruKatoh数据满族42.6%(43/101),文波的满族数据为44.4%(8/18),XUE中,赫哲族为44.4%(20/45)、锡伯族26.8%(11/41),鄂温克族23.1%(6/26),鄂伦春族19.4%(6/31),hammer鄂温克族数据为24.4%(10/41)。 蒙古人:喀尔喀蒙古zerjal数据22.8%(34/149),卫拉特蒙古1.0%(1/98),spencer数据外蒙古8.3%(2/24)、ToruKatoh数据喀尔喀蒙古18.8%(16/85)、乌梁海蒙古6.7%(4/60)、zakhchin蒙古8.3%(5/60)、khoton蒙古2.5%(1/40),Xue的数据内蒙古28.9%(13/45),外蒙古10.8%(7/65)、达斡尔族25.6%(10/39)。 突厥语人:ZhouRuixia数据:裕固族34.2%(18/52),维族12.2%(6/49),zerjal2001年的数据维族10.5%(7/67),XUE的数据:伊犁维族15.4%(6/39),乌鲁木齐维族6.5%(2/31),spencer在2001年的数据特别丰富:吉尔吉斯1/52,哈萨克9.3%(5/54),中亚维族12.2%(5/41)、图瓦人1/42,卡拉卡尔帕克人11.4%(5/44),克里米亚鞑靼人1/22,乌兹别克人14/326。Pakendorf在2006年的数据里,图瓦人1/55。土耳其人1/523。可以说,突厥人中,O3是普遍存在的,但比例都不高,和突厥邻近的塔吉克、伊朗、巴基斯坦等地也发现了O3,可能是突厥人、蒙古、契丹人或者汉唐时期华人的影响。尤其是哈萨克维吾尔等人群中O3比例远远高于西部蒙古人,显示了O3的来源绝对不只蒙古草原,古代中原人也参与了这些民族的形成。
五.走出东亚的土著人群——N和Q1 N和O是姊妹类型,大约在3万年和O分化,并在距今2~1.5万前从东亚出发,进入西伯利亚和东欧。 但N遗留在东亚的部分仍然是很多,不容忽视。 N可以分为N*、N1、N2、N3四个部分进行陈述。 N*是汉族的常见类型,在10个汉族人群总数1475人的样本中,共有100个N,占6.8%,最低频率为0,最高频率为15.0%(Hammer华南汉族6/40),其余如南京6.1%(49人/800人)、华北9.1%(4/44)、台湾6.0%(5/84)、四川8.8%(30人/341人)、兰州6.7%(2/30),所以说N是汉族非常重要的一个来源,以往很多数据没有单独检测该SNP,所以全部被归类到了K里,造成了汉族有K*的假想,实际上,汉族是不含东南亚的K*和中东的K2的。 N*最高频率出现在彝族等西南民族中,彝族Hammer2006年的数据为30.2%(13/43),附近的土家族4.1%(2/49),而四川汉族中为8.8%(30人/341人),西南地区可能是N*的大本营。 N1分布要小的多,目前看,最主要分布在中国,如Hammer的数据里为华北汉族2.3%(1/44),韩国人1.3%(1/75)、满族人1.9%(1/52),Xue的数据里为满族5.7%(2/35),锡伯族2.4%(1/41),布依族5.7%(2/35)。由于检测该SNP的论文只有这两篇,所以目前发现的人群还很少。 N2分布在西伯利亚西部和乌拉尔山脉地区,在蒙古地区有低频率分布。 如Pakendorf的数据中,图瓦人27.3%(15/55),由于该SNP也和N1一样很少被检测,所以很多数据都被归类到了K中。 在西伯利亚的通古斯人(Evenki)中,N2也很常见,如stony通古斯人为27.5%,yenisey通古斯为9.3%,中部地区的通古斯人为16%。 在蒙古和东北地区,如zerjal的数据,外蒙古为6.0%(9/149),中国鄂温克族2.4%(1/41)、布里亚特2.5%(2/81),如XUE的数据,内蒙为0/45,外蒙为2/65,东北地区,赫哲族最高,为8/45、满族为2/35、鄂伦春族为2/31,可以说N2在我国北方少数民族中也有一定分布,但汉族没有找到过任何N2。 N3是N的最重要的支系,分布地区从中国一直延伸到北欧的广阔地域。 在欧洲人中,在芬兰人、爱沙尼亚等人群达到60%,在立陶宛、拉托维亚等人群中占50%,在俄罗斯北部人中占35%,中部占20%,南部占10%,占挪威和瑞典人的5-10%,占德国人的3%。这里我们不过多讨论N3在欧洲的分布。 N3最高频率分布在西伯利亚,kharkov和brigitte的数据里,293个雅库特人有270人是N3,占92.2%。在通古斯人(Evenki)中okhotsk通古斯为37.5%、yenisey通古斯为9.7%、lengra通古斯为22.2%、中央通古斯为18%、讲雅库特语的通古斯人为70.7%、nyukzha通古斯人为20.5%、北部埃文人为90.9%,中部埃文人为8.3%、南部埃文人为12.9%,可以说N3在西伯利亚北部占绝对主体,南部西伯利亚则N3减少,C3c占了主体。 在蒙古地区,Pakendorf的数据,图瓦人的N3为9.1%(5/55),spencer的数据图瓦人为21.4%(9/42),外蒙古人,zerjal的数据N3为2.0%(3/149),XUE数据为内蒙13.3#(6/45)、外蒙古7.7%(5/65),toruKatoh数据喀尔喀蒙古4.7%(4/85)、乌梁海蒙古8.3%(5/60)、zakhchin蒙古3.3%(2/60)、khoton蒙古0(0/40),derenko布里亚特蒙古为18.9%(45/238),zerjal布里亚特为28.4%(23/81),卡尔梅克蒙古ivan的数据为1.0%(1/99),Xue的数据达斡尔族的N3为7.7%(3/39)。 在东北地区通古斯语人群,ToruKatoh满族为0(0/101),XUE的数据锡伯族为(2/41),赫哲族0/45、鄂伦春族0/31、鄂温克族0/26、满族为0(0/35)、hammer的数据,满族为0(0/52),鄂温克族为0、鄂伦春族为1/22。基本上,N3对东北地区通古斯语民族的影响非常微弱。 在汉族、朝鲜人、日本等东亚民族中,基本没有N3。但应该注意到的是在spencer的东干人中有N3(1/40),在zerjal的西北**也有N3(1/54),显示**有部分来自北亚草原的血统。 Q1是指汉族特有的M120,在2008写做Q1a1。 曾经有观点认为Q1是汉族特有的类型之一,但这种观点正在受到挑战。 应该说,目前公布的绝大部分数据里的Q1都来自汉族(目前论文数据里找到的大致在300个左右,有270左右来自汉族),复旦2002年的数据,北方汉族1054个人有60个Q1,占5.7%,南方汉族652人中有10个Q1,占1.5%。如马明义的四川汉族数据,341个人中有9个Q1,占2.6%,luchuncheng的南京汉族中,800个汉族有24个Q1,占3.0%,Zerjal的数据中,北方汉族Q1为4.5%(2/44),台湾汉族1.2%(1/84),Nonaka的台湾为1.1%(2/183)。 在汉族以外的汉藏语人群中,Q1也有发现,如董永利2005年白族起源一文中,在白族6.7%(2/30)、土家族3.1%(1/32)、藏族2.2%(1/46),如文波在摩梭人一文中,普米族为2.1%(1/47)。可以说,在汉族之外,Q1也是存在的,主要分布在西南汉藏语居民中,Q1不应该简单的看成汉族独有。 汉族以外发现Q1,东亚之外在东干人、巴基斯坦hazara人中找到过该类型。在东亚,在中国之外,在日本kanto地区为0.7%(1/137),冲绳东亚人类分布2.2%(1/44),nonaka数据韩国0.6%(2/317),zerjal数据越南7.1%(5/70)。 目前比较有说服力的观点认为,Q1是1.5~1.0万年前进入东亚的细石器文明的创造者,他们可能是从中亚进入草原后进入东亚的,并且一直分布到整个东亚,直到大致1万年前,O各个支系的扩张,才冲淡和驱逐了他们,造成了他们只有残留在汉族和其他东亚人群中,频率非常低。 六,综论 对东亚人来说,O是最大成分,O在除了西伯利亚的所有人群都有分布,而且在东亚和东南亚所有人口超过1000万的大人群中都是最大的成分(且均超过50%)。 C是其次大的,尤其是对北方人群来说,在蒙古和西伯利亚通古斯人中都超过了50%,但除了蒙古和哈萨克外,所有C占主体的民族人口基本都不超过10万,很多都是游牧和狩猎的几千人组成的小部族。 N是第三位的,但对中国西南的一些民族和西伯利亚,也是非常重要的。 D的分布比较局限,只有日本和西藏有比较高的频率。 Q1只低频率出现在东亚,没有一个人群超过10%。