출처: https://privatedevelopnote.tistory.com/81 [개인노트]
본문 바로가기

생명공학

[유전체 데이터 분석 내용 정리] 3-1. Sequencing - Sanger Sequencing (생어 시퀀싱)

목차

 ◎ Sanger Sequencing (생어 시퀀싱)

 ◎ 생어 시퀀싱의 원리

 ◎ 생어 시퀀싱의 장단점

 

◎ Sanger Sequencing (생어 시퀀싱)

 

지난 [유전체 데이터 분석 내용 정리] 2. 유전체 데이터 분석 개요 (Genome Data Analysis) 에서 유전체 데이터 분석 과정 중 Sequencing (시퀀싱) 과정에서 뭘 하는지 간략하게 소개했다. 이번 글부터는 시퀀싱 방법으로는 어떤 것들이 사용되고, 과정과 특징이 어떤지를 짚어보려 한다.

 

가장 처음 소개 할 시퀀싱 방법은 생어 시퀀싱이다. 생어 시퀀싱은 1977년 Frederick Sanger (1918 - 2013) 에 의해 개발되었으며, 지금은 다양한 NGS 방법들에 의해 주류에서는 밀려났다. 하지만 Human Genome Project에 쓰인 Automated Sanger Sequencing은 1세대 시퀀싱 (1st-generation Sequencing) 이라 불리는 맏형 격이고, 여전히 NGS 결과를 검증하는데에는 gold-standard로 쓰인다.

 

생어 시퀀싱을 이해하는 세 가지 키워드는 PCR, chain-termination, electrophoresis이다.

 

Frederick Sanger (1918 - 2013)

 

◎ 생어 시퀀싱의 원리

영상과 함께 읽는 것을 추천한다.

 

생어 시퀀싱은 PCR 과정을 통해 염기서열을 확인한다. PCR 과정에 필요한 준비물은 다음과 같다.

  1. amplified 된 DNA template: 시퀀싱될 대상
  2. primer: DNA 합성 시작
  3. DNA polymerase (중합효소): DNA 합성 수행
  4. 4 종류의 dNTP (deoxynucleotide triphosphate): A, C, T, G. DNA 합성에 사용
  5. 4 종류의 ddNTP (dideoxynucleotide triphosphate): A, C, T, G. 방사성 물질이나 형광물질로 표지 돼있음. chain-termination에 사용

하나의 DNA template을 시퀀싱 하기 위해선, 기본적으로 4개의 시험관에 DNA template과 primer, polymerase를 동일한 양을 넣어 DNA 합성 진행 준비를 한다. 이후 준비된 각 시험관에 동일한 양의 4 종류의 dNTP를 모두 넣어주는데, 합성에 사용될 재료를 넣어주는 셈이다. DNA 합성은 template에 결합된 마지막 dNTP의 3번 탄소의 수산화기 (-OH) 와 추가되는 dNTP의 5번 탄소의 인산기가 반응하여 이루어지기 때문에, 시험관에 dNTP만 있으면 단순 PCR과 별반 다를 게 없다.

 

Sanger가 시퀀싱을 위해 취한 전략은 ddNTP를 넣어 chain-termination을 유도하는 것이었다. ddNTP는 dNTP와 달리 3번 탄소에 산소가 결합하지 않아 정상적인 합성 반응이 이루어질 수 없고 결과적으로 DNA 합성을 중단시키는 chain-termination이 발생한다. Sanger는 이전에 언급된 4개의 시험관 각각에 한 종류의 ddNTP만을 넣는 방식을 취했다. (예를 들어 1번 시험관엔 ddATP만) ddNTP는 무작위로 합성중인 DNA 가닥에 붙으므로, 이렇게 하면 각 시험관마다 해당 ddNTP의 다양한 위치를 표지한 집합이 생기게 된다.

 

이후엔 열을 가해 template과 함성된 DNA 가닥을 분리하고, 후자를 electrophoresis를 사용해 크기에 따라 분류한다. ddNTP는 방사성물질이나 형광물질로 표지 돼있다 했으므로, X-ray와 같이 표지들을 읽을 수 있는 방법을 사용해 위치 순으로 정렬된 염기를 읽어내면 시퀀싱 결과를 얻을 수 있다.

 

◎ 생어 시퀀싱의 장단점

생어 시퀀싱의 두드러지는 장점은 정확성이다. 또 하나의 장점은 500~1kb의 비교적 긴 DNA fragment를 시퀀싱할 수 있다는 것이다. 하지만 모든 서열이 균등하게 퀄리티가 좋은 것은 아니다 ( = 정확도가 높은 것은 아니다). read의 뒤쪽은 read 길이에 따라 좌우되지만, 앞쪽은 primer로 인해 일반적으로 정확도가 떨어진다 보고되어 trimming이 권장된다. 또 throuhput이 매우 낮다. Throughput은 시퀀싱에 걸리는 시간, 동시에 시퀀싱 될 수 있는 양, 시퀀싱 가능한 길이에 대한 함수인데, 쉽게 말해 처리효율이다. 생어 시퀀싱은 electrophoresis를 포함하기 때문에 걸리는 시간이 늘어나고, 동시에 처리될 수 있는 양이 줄어 throughput이 줄어든다. 아무리 자동화를 했다 하더라도 2012년 개제 된 논문에 따르면 115kb/day밖에 되지 않는다고 한다.

 

이러한 특징 때문에 생어 시퀀싱은 적은 양의 DNA fragment를 검증하기 위한 시퀀싱에 자주 사용된다.

 

 

[참고자료]

http://t0.gstatic.com/licensed-image?q=tbn:ANd9GcTolryOURBdkGP0lX74CU2en2RQBTrtz46P-P7sn1WuLm5b4WxNuJS29pEd_qqK

 

https://en.wikipedia.org/wiki/Sanger_sequencing

 

Sanger sequencing - Wikipedia

From Wikipedia, the free encyclopedia Jump to navigation Jump to search Method of DNA sequencing developed in 1977 Sanger sequencing is a method of DNA sequencing based on the selective incorporation of chain-terminating dideoxynucleotides by DNA polymeras

en.wikipedia.org

http://www.incodom.kr/Sanger_sequencing

 

Sanger sequencing

# Sanger sequencing

www.incodom.kr

Rizzo, Jason M., and Michael J. Buck. “Key principles and clinical applications of” next-generation” DNA sequencing.” Cancer prevention research (2012): canprevres-0432.

 

Key Principles and Clinical Applications of “Next-Generation” DNA Sequencing

Demand for fast, inexpensive, and accurate DNA sequencing data has led to the birth and dominance of a new generation of sequencing technologies. So-called “ next-generation ” sequencing technologies enable rapid generation of data by sequencing massiv

cancerpreventionresearch.aacrjournals.org