Treemix로 살펴보는 동아시아 인구집단들의 역사 - 3

5. m = 8,Treemix plot for East Asians



지난 번에 이어서 m=8 일 경우입니다. 그래프에서 이주지시선이 8개나 되니, 좀 복잡하므로, 아래와 정리해 봅니다. 

1) Yakut è Mongol
2) Yakut è Tu
3) Yakut è Xibo
4) Dai è Han
5) Yizu è Lahu
6) (Jap,Kor) è Hezhen
7) Yakut è (Yizu, Naxi)
8) Yakut è Cambodian

위의 1) ~ 6)까지는 앞에서 이미 언급한 것들입니다. 7)은 Yakut => Yizu과 Naxi의 공통조상으로 인데, 이것은 아마도, 북쪽의 유라시아 초원의 길로부터 동아시아 최초로 청동기롤 받아들여 발달시킨 감숙성과 청해성지역의 Qijia문화로부터 Kayue문화에까지 청동기문화가 전파되고, 이 청동기 문화인들이 티벳고원과 사천성 등, 서남방면으로 뻗어나간 것에서 나온 것이 아닌가 생각합니다. 8)은 Yakut에서 왜 Cambodian으로 약하게 나마 이동이 있는 지, 좀처럼 떠올리기어려운 데, 13세기 Mongol제국이 현재 중국 운남성지역의 대리국을 정벌하였고, 그 여파로 인해, 원래 운남성지역에 살던 Tibeto-burman계나 Thai계통 민족들이 동남아시아 방향으로 남하해서 각지에 자신들의 국가를 건설하였고, 이러한 인구 이동들에서 Cambodian이 간접적으로 영향을 받은 것일 가능성이 있다고 봅니다.

m = 8 을 넘어서 9이상의 숫자로 계산을 돌리면, 현재의 SNP숫자로는 무리인지, 에러가 발생합니다. 그러므로, HGDP자료와 23andme의 한국인 자료를 결합시킨 이번자료로는 여기까지가 탐구할 수 있는 한계로 보입니다. J. Pickerell이논문(2012)에서 이미 밝히고 있지만, 여기서 지적하고 가야할 Treemix 모델링의 문제점은 , admixture가 비교적 짧은 시기 동안, 한번에 집중적으로 일어난 것으로 가정하고, 이러한 가정에 부합하는 admixture 이벤트는 잘 잡아 내지만,장기간에 걸쳐, 조금씩 일어난 admixture의 신호를 탐지하기에는 부적합하다는 것입니다. 그러므로, 위의 m=8까지의Treemix plot에 나타나지 않았다 해도, 장기간에 걸친, 소규모로 반복적으로 진행된 admixture 이벤트는 있을 수 있습니다.

이상이 Treemix plot으로 살펴 본 동아시아 인구집단들의 역사라면, 이 그래프들에서 나타나지 못한, 즉, 위 트리와이주지시선의 모델링에 드러나지 못했지만, admixture의 가능성이 있는 사건들은 Residual plot으로 또한 살펴 볼 수 있습니다 (The residual plot is supposed to graphically present pairwise admixture likelihoods between populations that may not have been present in the tree graphic because they were not well-modeled)

1) m=0, Residual Fit Plot



Residual plot에서는 레전드에서 볼 수 있듯이, 검은색 혹은 짙은 청색에 가까울수록, admixture가 발생했을 가능성이큰 조합이 되는 것입니다. 위의 Residual plot은 앞의 2에서 다룬 m=0인 경우,Tree와 이주지시선이 모델링하지 못한 나머지 부분들을 그래프로 나타낸 것입니다. 여전히 Yakuts에서 Mongol,Xibo,Tu 등 여러 북방민족으로 강한 admixture가 암시되고 있습니다. 그리고, 한국인과 관련해서는She,Tujia,Han 등이 약간의 약한 admixture가 일어났음이 암시되고있습니다.

이주지시선이 From과 To를 분명히 지시해서 가르키는 Tree plot과 달리, Residual plot에서는 위 조합 중에 어디에서어디로 admixture가 이루어졌는 지, 방향이 없기 때문에 다소 혼란스럽습니다. 그러나, Yakut와 여러 북방민족들의 조합은admixture가 Yakut로부터 나와서 이루어졌다는 것을 Tree plot을 통해, 이미 알 수 있습니다.

2) m=8, Residual Fit plot



위의 m=0의 Residual plot과 비교할 때, m=8에서 이미 각 인구집단의 분화관계와 admixture 이벤트가 거의 충분히 모델링되었기 때문에, 남아 있는 Residual fit의 조합들은 신호가 미약합니다. Yakuts에서 Oroqens는 Tree plot에서 여지껏 나타나지 않았기에, 아직 강력한 암시를 보이고 있습니다.한국인과 관련해서는 She 혹은 Japanese와 미약하나마,
admixture의 가능성이 암시되고 있으나, 단순한 노이즈일 수도 있습니다.

앞으로, 더 많은 숫자의 공유하는 SNP와 다른 인구집단들로 Treemix나 혹은 다른 더 개선된 도구를 사용하면, 한국인상염색체에 남겨진 Admixture 이벤트를 보다 분명히 탐지할 수 있으리라 기대해 보며, Treemix를 통한 이번 탐구를 마칩니다. 이제까지, 제가 시간관계상 한 번에 올리지 못하고, 격주에 걸쳐, 올린 글들을 계속 읽어 주신 분들께 감사드립니다.