인구집단의 변화와 구성의 역사를 알기 위해서, 가장 좋고, 확실한 방법은 고인골을 될 수 있는 한, 많이 발굴해서, 그 DNA를 조사하는 방법입니다. 그러나, 시간이 거슬러 올라 갈수록 고인골이 대량으로 발굴되기쉽지 않거니와, 발굴된 고인골이 이미 완전히 석화가 된 경우가 많아서, 유전자를 채취해서, DNA를 조사하기가 쉽지 않습니다. 또, 시료 오염 등의 문제로 정확한 결과를 얻는 데는 상당한 기술과 비용이 필요합니다.그리고, 고인골이 조사되어야 하는 곳도, 하나의 지방이나 하나의 국가 내에서가 아니라, 오래 전일수록 인구집단이 다양한 경로를 통해 이동해 왔을 가능성이 크기에, 여러 곳에서 만족할만한 고인골 자료를 얻는 것도 쉽지 않은 문제가 될 것입니다.

특히나, 한반도와 같은 산성이 강한 토양에서는 고인골이 쉽게 부식하기에, 자료를 얻기가 쉽지 않아서, 현재까지는 고인골의 유전자에 대해서, 그나마 약간의 자료가 존재하는 것은 거의 모계를 추적하는 mtDNA와관련된 것이고, 분석한 연구도 거의가 여기에 한정되어 있습니다. 물론 Y하플로와 mtDNA하플로의 부계와모계 연구를 통해서도 역사적인 추적이 가능하지만, 부계와 모계 하플로는 founder effect등을 통해서, 인구집단의 변화의 양상이 심하게 왜곡되게 보여줄 수 있고, 유전자 연구의 주요한 목적인 인구집단 간의 질병저항성 차이, 표현형, 환경 적응 등 문제에 대해서, 해답을 주기 어렵기 때문에, 수집과 분석이 용이한 현대인의상염색체에 대한 연구를 통해서, 인구집단의 구성과 변화의 역사를 알려는 시도가 계속 있어 왔습니다.

현재까지 여기에 대해 가장 주목할 만한 해결책을 내놓은 연구 그룹은 David Reich 가 이끄는 하버드 대학연구진입니다. 다음의 링크된 이들의 홈페이지에 가보면, 여러가지 상염색체 분석을 위한 분석도구들이 소개되어 있고, 직접 다운로드가 가능하게 되어 있습니다

( http://genetics.med.harvard.edu/reic.../Software.html ). 오늘 소개하고자 하는 Treemix는 원래David Reich와 같이 작업하다, 현재는 독립해서 New York Genome Center에서 lab을 운영하고 있는 Joseph K. Pickrell이 개발한 것입니다( http://jkplab.org ). 하버드대 연구진이나 Pickrell이 개발한 도구들이 상염색체로 인구집단의 변화를 알 수 있는 것은 Lingkage Disequilibrium에 대한 분석과 계산을 통해서입니다.

집단유전학(Population genetics)의 기본이 되는 원리인 Hardy-Weinberg Equilibrium 에서는 어떤 인구집단에서 다른요인이 영향을 주지않으면, 그 집단의 유전자와 유전자형의 빈도는 항상 일정하게 유지된다는 것입니다. 그러나, 이러한 평형은 현실에서는 결코 존재하지 않는 데, 왜냐하면 인구집단에 대해서, 항시적으로변화를 이끄는 요인들이 존재하기 때문인 데, 그 요인으로 대표적인 것으로, mate choice(성선택), mutation(돌연변이), selection(적응선택), genetic drift(유전적 표변), gene flow (이주나 혼혈을 통한 유전자교류)등이 있습니다.

인류(Homo sapiens)는 지구상의 다른 어떤 종보다 활발한 이동을 하였고, 이동을 통해 만나는 다른 인구집단들과의 Admixture를 통해서, 또 변화한 환경에 적응하기 유리한 유전자를 얻거나, 새로운 질병에 대한 저항성을 얻어왔습니다. 이미, 역사시대가 되면, 위에 열거한 평형을 깨는 다른 요인들이 진화적으로 비교적긴 시간을 필요로 하거나, 단기간에서는 소규모로만 영향을 줄 수 있는 반면, gene flow는 단기간 내도 빠르게 일어날 수 있고, 영향력이 큰 경우도 많기 때문에, 인구집단 내 disequilibrium을 일으키는 가장 주요한 요인이 된다고 할 수 있습니다. 즉, 이들 분석도구들은 경제학의 Ceteris paribus와 마찬가지로, 다른 요인들은일단 동일하다고 가정하고, admixture를 통해서만, 불평형이 일어난다고, 가정하고, 불평형의 비율이나 분산등을 계산해서, 인구집단의 구성과 이동방향, 혼혈시기 등을 추정하는 것입니다.

Treemix가 다른 분석도구와 차별화되는 것은 분자인류학 분야에서 처음으로 이용되었고, 현재도 많이 이용되고, 개선이 이루어지고 있는 Structure나 Admixture은 인구집단을 구성하는 조상인구집단의 구성을 알려주기만 하지만, Treemix는 인구집단 끼리의 유전자 교류가 어느 방향으로 일어 났는 지를 알려 줄 수 있습니다. 또한, 종의 분화와 발전을 보여 주기 용이한 Tree chart 형식이기에, 인구집단끼리의 친소관계와 분화관계를 파악하기도 쉽습니다. Structure나 Admixture는 분석대상이 된 샘플수나 유전자수가 많을수록, 혹은 더세분화해서 보고자하는 K값이 높을수록, PC로 이를 수행하기에는 많은 시간이 필요하거나, PC로는 아예 실행이 되지 않을 수 있습니다. 반면, Treemix는 대부분 10분 이내 PC로도 분석이 가능하다는 장점이 있습니다.

이러한 이점이 있기에, 분자인류학분야에서 비록, 아마추어 연구자이지만, 전문연구자 못지 않은 학식과 실력이 있는 세계적인 블로거들인 Dienekes( http://dienekes.blogspot.com ), Razib Kahn( http://www.unz.com/gnxp ), Magnus Duncatus( http://magnusducatus.blogspot.com ) 등도 Treemix로분석한 결과를 블로그에 많이 올리고 있습니다. 이들이 Treemix로 한 분석은 전세계적인 범위이거나, 그들이 관심이 많은 유럽이나 인도지역 위주이기 때문에, 동아시아 인구집단만을 대상으로 분석한 자료가 드뭅니다. 그러기에, 아래에 제가 분석한 자료들은 동아시아 인구집단들 위주로만 되어 있기에, 동아시아에서의인구집단간의 Gene flow나 분화관계를 보다 상세히 보여 줄 수 있다고 생각합니다.

우선, 카페에서 동아시아인 상염색체 분석을 위해 이용하는 KMG9의 각 가상 조상 인구집단(Hypothetical ancestral Populations) 간의 관계를 Treemix로 알아 보겠습니다. 아래는 KMG9에서 각 가상조상 인구집단을대표하는 것으로 나오는 현대 인구집단들의 거주지역을 지도로 나타낸 것입니다

아래의 그래프는 위 가상의 9개 조상인구집단의 관계를 Treemix로 계산하여, 나타낸 것입니다.



위 그래프에서 Migration Weight는 빨간색으로 갈수록 높은 비중으로 migration 및 admixture가 이루어진 것을 나타내는 것입니다. 위 그래프에서 두 개의 선이 나오는 데, 하나는 She에서 Cambodian으로 향하고 있고, 다른 하나는 Cambodian에서 Naxi, Japanese, She가 분화되기 이전의 원시집단에게로 향하고 있습니다. 여기서 다시 되새겨야 할 것은, 데이타를 가지고, 이런 계산을 돌리는 것이 중요한 것이 아니라, 나온 결과를 어떻게 해석하느냐가 중요합니다. 앞에서 언급했듯이, Disequilibrium을 가져 오는 여러 요인들 중에, gene flow만이 아닌 다른 여러 요인들이 때에 따라서는 영향을 줄 수 있고, 혹은 데이타 자체가 어떤skewed 집단에서 나온 것이라면, 계산도구가 좋더하더라도, 결과가 왜곡될 가능성이 크기 때문입니다.

이런 사실을 염두에 두고, 해석해 보자면, 원래 KMG9의 Cambodian에는 Austro-asiatic에 속하는 Mon-Khmer계열의 캄보디아인과 Lahu족 ( 라후족은 언어적으로는 Tibeto-Burman에 속하지만, 상염색체상으로는 매우 높은 동남아시아성분을 나타내므로, 일부 Tibeto-Burman계에 언어적으로 동화된 동남아시아인이라고 보아야 할 것입니다.) 등이 높은 비율로 나타나는 데, 이 Austro-asiatic이 인도차이나반도에 진입하기 이전에 현재 필리핀이나 Andaman제도 등에 남아 있는 Negrito계열이 이미 존재했다고 보는 것이 일반적입니다. Austro-Asiatic계열이 가장 먼저 수도작을 중국 남부지역에서 했을 가능성이 크므로, 이들이 발전된 농업기술로 인구확장으로 인도차이나반도에까지 와서, 대부분의 Negrito집단을 몰아내고, 주인이 되었을 것이나 일부는 혼혈이 되었을 것입니다. 위 그래프에서 3개의 서로 다른 분지로 분화되기 이전의 동아시아인은 아마도, 중국남부에서 Austro-asiatic과의 접촉을 통해, 농업을 배우고, 이후에, 각기 다른 집단으로 분화해 갔을 가능성이 있다고 봅니다.시기적으로는 중국 호남성 Pengtoushan유적의 탄화미가 대략 B.C.8000년경으로 추정되고, 최근에 이보다 더 오랜 쌀의 재배지도 강서성지역에서 발견되었다 하므로, 지금으로부터 10,000년전 무렵이라고 봅니다.

반대로, She에서 Cambodian으로의 향하는 이동방향은 보다 늦은 시기, Hmong-Mien이나 Austronesian계통의 확장과 연관이 있는 것으로 생각합니다. 얼마 전에 언급한 바도 있지만, KMG9의 She에는 서로 구분될 가능성이 있는 다양한 성분이 섞여 있는 것으로 보이는 데, 대표적으로 She족이 속한다고 여겨지는Hmong-Mien(즉, 중국에서는 묘요계라 칭함), 산동반도에서 양자강 중류에 걸쳐 존재한 동이계통(아마도 이들과 Proto-Tai-Kadai는 서로 구분하기 어려운 그룹이 아닐 지?), 양자강 하류에서부터 해안선을 따라 분포하다, 대만을 거쳐, 태평양각지로 이동한 Austronesian계통 등입니다. Hmong-Mien이 언어적으로Austroasiatic에 가장 가깝다고 하는 데, 이는 중국 남부(아마도 양자강 중류)에서 이른 시기에 접촉이 있었고, 이후에, 운남성이나 광서자치구 등 보다 동남아와 가까운 지역에서도 밀접한 접촉이 있었지 않나 생각합니다. 그리고, 좀 더 내륙에 가까운 광서자치구를 통해서 확장했을 Tai-Kadai계통이나, 아래 그래프(David Reich et al. 2014)와 같이 해안가를 따라서 확장한 Austronesian계통이 말레이반도를 거쳐, 인도네시아로 가기 전에,이들에게 영향을 주었을 것입니다.



출처 - by me
http://cafe.daum.net/molanthro