목차
◎ SBL
◎ SBS
지난 3-2 글에 이어서 short-read NGS를 sequencing by ligation (SBL), sequencing by synthesis (SBS) 로 나누어 알아보려 한다.
◎ SBL
영상과 함께 이해하는 것을 추천한다.
Thermo Fisher의 SOLiD, BGI의 complete genomics technology가 대표적인 SBL은 형광 표지가 있는 probe 시퀀스를 사용하는 것이 특징이다. probe 시퀀스는 template 서열에 따라 다른 색의 형광을발광할 수 있는데, template으로부터 하나의 염기서열만 읽느냐 두 개를 세트로 읽느냐에 따라 생김새가 조금 달라지고 SOLiD에서 사용하는 후자의 경우 다음과 같이 생겼다.
보면 맨 왼쪽에 있는 2개의 염기서열은 실질적으로 template의 서열을 읽는다. 2개의 서열의 구성이 어떠냐에 따라 4가지 색을 발할 수 있고, ligase가 primer 혹은 앞에 위치한 시퀀스가 연결하는 대상이 된다.
중간은 universal base로 어떤 염기서열과도 결합할 수 있다.
맨 오른쪽의 3개 염기서열은 형광 역할로, 형광의 색을 기록하는 과정이 되면 cleave (떨어져나감) 되어 제거된다.
우선 primer가 apater와 결합하고, 이후 probe들이 순차적으로 template과 결합하게 된다. 결합한 probe는 template과의 상보결합에 따라 형광을 발광할 것이고, 감지가 끝나면 probe의 형광부분이 cleave된다. 이 때, probe가 하나의 염기서열만 읽으면 그 형광 정보를 base-space, 두 개를 세트로 읽으면 그 형광 정보를 colour-space 라고 한다.
이러기를 반복하여 template을 probe로 꽉 채웠다 해보자. 그러면 모든 시퀀스를 알아낸 것일까? 아니다. 왜냐하면 universal base 부분이 존재하기 때문이다. 정리하자면 probe가 위의 그림대로 생겼다면, 우리는 한 번 template을 따라 꽉 채웠을 때 (이걸 round라 하겠다) 5번째 마다 위치하는 dinucleotide의 정보밖에 알지 못한다. (서열이 아니라 어떤 형광인지에 대해)
universal base 부분의 정보를 알기 위해선 한 번의 round가 끝나면 primer를 원래 위치보다 1 base 위로 가게끔 재디자인해 이전 round와 같은 과정을 반복하는 primer offset 조정 과정을 시행하면 된다. 따라서 probe가 위와 같이 생겼다면 총 5번의 round가 필요한 셈이다.
모든 round가 끝나면 형광 정보 (base-space / colour space) 를 사용해 염기서열을 해독해야한다. 이 때 primer의 서열 정보는 알고있고 probe의 서열은 둘 중 하나만 알면 나머지는 알 수 있으므로, probe의 염기와 위치상 일치하는 primer의 염기 서열을 알아내면 template의 염기서열을 해독할 수 있다.
◎ SBS
SBS는 SBL과 달리 probe 시퀀스가 아닌 polymerase를 사용한다. NGS하면 보통 떠올리느 시퀀싱 방법으로, 가장 큰 market share를 차지하기 때문이다. SBS는 다시 cyclic reverse termination (CRT) 방식과 single-nucleotide addition (SNA) 방식으로 나눌 수 있다. CRT 방식은 생어 시퀀싱과 비슷하게 3'-OH 를 block하는 기능이 있는 dNTP를 모두 넣어넣고 사용하고, SNA 방식은 한 종류의 dNTP 씩 순차적으로 넣어 사용하는 방식이다.
◎ CRT
영상과 함께 이해하는 것을 추천한다.
CRT 방식을 사용하는 플랫폼은 illumina와 Quiagen이 대표적이다. 우선 primer가 adapter와 결합하면, ploymerase가 이 compex를 따라 dNTP를 합성한다. 이 때, dNTP는 앞서 설명한대로 3'-OH가 block 되어있고 형광 표지 돼있다. 4 종류의 dNTP가 모두 넣어져있지만, block 때문에 template과 상보적 결합이 이루어진 하나의 dNTP 이후로는 합성이 잠시 멈추게 된다. 이 때 그 dNTP의 형광을 감지하여 시퀀스를 알아낸다. 이후 형광 표지와 block 기능을 제거해 다음 dNTP가 결합하는 과정을 반복하여 시퀀싱이 이루어진다.
◎ SNA
4 종류의 dNTP를 모두 사용한 CRT 방식과 달리, SNA 방식은 합성 시 한 종류의 dNTP만을 사용하길 반복한다. 따라서 CRT 방식처럼 3'-OH를 block할 필요가 없다. SNA 방식을 채낵한 플랫폼으로는 Thermo Fisher의 Ion Torrent가 대표적이며, 관련 영상은 이전 글에 링크를 걸어놨으니 보면서 이해하길 추천한다.
[참고자료]
'생명공학' 카테고리의 다른 글
[유전체 데이터 분석 내용 정리] 3-2. Next Generation Sequencing (NGS), short-read NGS (1) (0) | 2021.09.07 |
---|---|
[유전체 데이터 분석 내용 정리] 3-1. Sequencing - Sanger Sequencing (생어 시퀀싱) (0) | 2021.09.07 |
[유전체 데이터 분석 내용 정리] 2. 유전체 데이터 분석 개요 (Genome Data Analysis) (0) | 2021.09.03 |
[유전체 데이터 분석 내용 정리] 1. 생명정보학 (Bioinformatics) (0) | 2021.09.03 |
로그 스케일 (0) | 2021.04.26 |