출처: https://privatedevelopnote.tistory.com/81 [개인노트]
본문 바로가기

생명공학

DNA databases are too white, so genetics doesn’t help everyone. How do we fix that? (1)

모바일 크롬에 접속하면 제일 먼저 뜨는게 신문기사나 매거진들이다. 오늘은 그 중에서 재밌는 글이 있어 해석을 하고 내용을 정리해보려 한다.

 

science news라는 미국 격주 매거진에 실린 기고로, 제목은 이 글의 제목과 같다. Tina Hesman saey가 작성하였다.

www.sciencenews.org/article/genetics-race-dna-databases-reference-genome-too-white

 

DNA databases are too white, so genetics doesn’t help everyone. How do we fix that?

A lack of diversity in genetic databases is making precision medicine ineffective for many people. One historian proposes a solution: construct reference genomes for individual populations.

www.sciencenews.org

Human genome project는 20년주기를 맞았지만, 인간 유전체 해석이 가져올 정밀의학(precision medicine)이라는 장미빛 미래는 아직도 멀기만하다. 물론 연구자들의 대단한 노력과 성과 덕분에 어떤 유전자 변이가 어떤 증상과 관련있는지 혹은 약물 반응성에 얼마만큼 영향을 미치는지는 점점 밝혀지고 있다. 하지만, 이러한 발견들마저도 단 하나의 인종에 대해서만 뚜렷하게 적용되는 실정이다. 그 수혜자는 바로 유럽 대륙에 선조를 두고 있는 사람들로, 다른 말로 백인(white people)이다.

 

North Texas대의 evolutionary historian(진화 역사학자?)인 Constance Hilliard 교수는 지금의 Human referecen genome은 사실상 European genome이라 말하며 유럽쪽에 뿌리를 두지 않는 사람들에 대해선 실효성이 없다고 말했다. 그녀는 Human genome project 뿐만 아니라 상당수의 genetic information database가 백인 피실험자의 정보로 구축됨을 꼬집었다. 이렇게되면 축적된 변이에 대한 정보들은 'human' genome data라 부르기엔 human의 다양성을 반영하지 못한다 (일종의 오버피팅 현상인 것 같다).

 

실제로 아프리카인, 아시아인, 미국 원주민, 태평양 섬쪽 인종 계통은 oncogenic variant의 유무나 약물 반응성을 검사하기 위해 DNA test를 받으면 그 결과가 유럽 계통 인종만큼 명확하지 않다고 한다.

 

Hillard교수는 이러한 genomic data 편중현상을 해결하기 위한 한가지 방법으로 reference genome을 암들보다 특정 질병이나 건강 문제에 대해 징후가 좋지 않은 그룹에 대해서 만들기를 제안하고있다. ~암 그룹, 심장병 그룹 이런식으로 나눠서 reference genome을 만들어보자는 것이다. 또, 노예제도로 인해 미국으로 유입된 아프리카인을 선조로 하는 아프리카계 미국인과, 그냥 최근에 이주하여 살게된 아프리카계 미국인은 DNA에 남아있는 history가 다를테니 이런 것도 분별해서 알아보자고 제안하고있다.

 

(대학생 나부랭이가 이런 아이디어가 좋은 아이디어인진 모르겠지만) Hillard교수가제시한 방법 외에도 genomic diversity를 확보하기 위한 많은 노력들이 이뤄지고 있지만, 전망이 마냥 밝은 것은 아니다. 하나하나가 걸림돌일 것이다. 어떻게 연구참여자를 다양화할것인가부터 각 국가별 연구비사정, 윤리 등등...genomic data가 white genome이 된건 가장 먼저 결승선에 도달한 것이 그 집단이어서인 면도 있다. 하지만 어떤 이유로든 현 상황을 좌시하는 것이 정답이 아님은 확실하다. precision medicine의 달성을 위해, 또 데이터 편중현상이 불러올 차별을 막기 위해서라도 다양성 확보는 반드시 해결해나가야할 과제임은 분명하다.

 

Why is genetics so white?

유전체 연구가 백인 data 편중현상에 허덕이고 있다면, 애초에 그렇게 Human genome project를 설계하지 않았으면 될 일 아닌가? 뭐가 문제의 시발점이었을까?

 

그 질문에 대답하려면 Human genome project의 시작부터 짚어 봐야 한다. Human genome project는 1997년 Buffalo News에 광고를 실어 reference genome을 구축하는데 일조할 피실험자를 모집했다. 이름에서 알 수 있듯, 당연히 영미권 신문사 (혹은 잡지사)였을거고, 피실험자 또한 대다수 영미권 사람이었을 것이다.

 

하지만, 그렇다고해서 reference genome이 백인으로만 이루어진것은 아니다. U.S. National Library of Medicine의 staff scientist이자 Genome Reference Consortium의 멤버인 Valerie Schneider에 따르면 referece genome은 60명 이상의 DNA로 이루어졌다고 한다. 그 중 한 아프리카계 미국인인 남성의 DNA가 reference genome의 70% 가량을 구성하고 있는데, 그의 부모님은 한 쪽은 유럽인, 다른 한 쪽은 남아프리카인이다. 다른 10명은 reference DNA의 23%를 차지하는데, 그 중 최소 한 명은 동아시아 사람이고 7명은 유럽계통이라고 한다. 그리고 50명이 이상의 DNA가 나머지 7% 가량을 구성하고 있다고 하는데 이들의 인종 정보는 알려져있지 않다고 한다.

 

 또, reference genome의 구성이 어찌됐든, 모든 사람의 DNA는 기본적으로 구조가 비슷하다. 서로 다른 사람끼리의 일치율이 99.9%정도에 육박한다. 이 점이 바로 reference genome이 유의미해지는 지점이다. 다만, 서로다른 그 0.1%가 질병이나 치료에 있어 차이점을 유발한다는 것이 주목해야할 부분이다. (사실 사람과 침팬지의 DNA 일치율은 약 98%이고, coding gene은 DNA bp의 1%만 차지한다는걸 생각하면 reference genome의 타당성과 0.1%의 impact 모두어느정도는 이해가 간다)

 

이 0.1%의 차이가 어떤 효과가 있는지 알아보는 분석방법은 GWAS(Genome-Wide Association Studies)라고 하는데, cell지의 report에 따르면 2018년 기준 이 분석의 참여자의 78%는 유럽 계통이었다고 한다. 이는 2009년 보다는 나아진 수치인데, nature지의 report에 따르면 96%가 유럽계통이었다고 한다. 물론 아직도 가야할 길이 많긴 하지만(산술적 균등이 reference genome의 지향점이여야할지도 고민해봐야한다) 다양성이 는다는 것은 특정 변이에 대해 이상이 있다 혹은 없다를 판가름할 자원이 많아진다는 의미이고, 0.1% 내에서 세세한 차이를 찾아낼 가능성이 높아진다는 의미니까 좋은 현상이다.

 

연구자가 누구냐도 genome data의 불균형을 초래하는 원인이 된다. University of California의 epidemiologist인 Sam Oh에 따르면 피실험자를 모집하는데 있어 연구자와 비슷한 배경을 공유하는 사람들이 라포 형성에 유리하기 때문에 더 모집하기 쉽다고 한다. 이런 전제 하에, NIH의 지원을 받는 연구의 대부분은 백인 연구자가 진행한다는걸 고려하면 쉽게 말해 백인이 백인을 부르는 현상이라 할 수 있겠다.

 

When origins matter

앞서 소개했던대로, Hillirad 박사는 precision medicine을 구현하려면 징후가 유별나게 좋지 않은 그룹에 대해 연구를 진행해야한다고 제안한다. 예를 들어 노예제도로 인해 유입된 선조들을 두는 미국의 흑인들은 신장 관련 질병에 걸릴 확률과 고혈압, 그리고 특정 암에 걸릴 확률이 다른 인종에 비해 높다는 사실을 바탕으로 그들을 한 그룹으로 묶는 것이다.

 

해당 그룹(미국의 아프리카계 미국인)은 백인들에 비해 유방암과 전립선암으로 인한 사망률이 높지만 골다공증으로 인한 골절 환자는 적다. 이 사람들은 칼슘 흡수를 돕는 TRPV6라는 유전자에 변이가 있었고, 변이로 인한 과발현이 유방암과 전립선암의 원인이었다.

 

이 변이는 해당 그룹의 선조로부터 유래됐다. 그들의 선조는 니제르-콩고 지역 서아프리카인들인데, 그 지역은 흡혈파리로 인해 젖소들이 죽어 칼슘 섭취량이 적었다고 한다. 따라서 TRPV6가 칼슘 흡수량을 늘리는 방향으로 변이가 발생했을 것이라는게 Hillard 박사의 추측이다.

 

Hillard 박사는 결과적으로 필요로하는 칼슘랑은 같더라도, 해당 그룹의 칼슘 흡수율이 과하게 높은 상황에서 변이가 없는 그룹과 같은 칼슘량이 제공된것이 그들이 겪는 질병의 원인이라고 2018년 Journal of Cancer Research & Therapy지에 발표한 바 있다.

 

안타깝게도 현재는 유럽 계통 인종의 TRPV6에 대해서 연구가 진행되고 있기 때문에, 누구도 유의미한 결과에 대가가지 못하고 있다는 것이 Hillard 박사의 의견이다.

 

One size doesn’t fit all

몇몇 의사나 연구자들은 인종 정보에 기반한 정밀 의학을 옹호한다. 환자가 어떤 계통의 유전 정보를 가지고 있는지를 분석한 뒤 처방을 그에 맞게 하자는 것이다. 앞서 인종적으로 치우친 유전 정보가 문제다라고 말한터라 이런 접근 방식이 일리있어보일 수 있지만, 이러한 인종적 접근은 오히려 역효과를 불러올 수 있다.

 

Plavix라는 이름으로 시중에 있는 항혈소판제를 예로 들어보자. 이 약은 심장마비의 위험이 있는 사람들에게 처방되고 CYP2C19 라는 효소가 이 약을 간에서 활성상태로 만든다.

 

변이가 있는 CYP2C19는 그 약을 활성상태로 만드는 효율이 떨어지거나 아예 활성상태로 만들지 못한다. 그런 형태의 효소는 아프리카나 유럽계 사람들보다 아시아나 태평양계 사람들한테 많다고 한다. 그러면 태평양계 사람들한텐 이 약이 효과가 떨어질거라 결론지으면 되는걸까?

 

바누아투 지역 멜라네시아 사람들의 60~70%가 효율이 떨어지는 효소를 가지고 있는 것은 사실이지만, 이웃한 피지나 사모아, 통가, 쿡 섬 지역 폴리네시아 사람들은 4%, 뉴질랜드 지역 마오리 사람들은 8%만 가지고있다는 것도 사실이다. 따라서 속지주의적으로 유전적 특성을 유추하는 것은 상당히 부정확하다.

 

따라서 Hillard 박사는 인종에 대해 왈가왈부하기보단 그들의 유전적 기원이 처했던 환경이나 배경에 대해서 탐구해야한다고 얘기한다. 결국 앞서 얘기한 genome data의 대부분이 백인인것이 문제라 한 의미는 '인종'이 문제가 아니라 다양한 '환경'이 반영이 안됨을 꼬집었던 것이다.