분류 전체보기 (12) 썸네일형 리스트형 [유전체 데이터 분석 내용 정리] 3-3. short-read NGS (2) 목차 ◎ SBL ◎ SBS 지난 3-2 글에 이어서 short-read NGS를 sequencing by ligation (SBL), sequencing by synthesis (SBS) 로 나누어 알아보려 한다. ◎ SBL 영상과 함께 이해하는 것을 추천한다. Thermo Fisher의 SOLiD, BGI의 complete genomics technology가 대표적인 SBL은 형광 표지가 있는 probe 시퀀스를 사용하는 것이 특징이다. probe 시퀀스는 template 서열에 따라 다른 색의 형광을발광할 수 있는데, template으로부터 하나의 염기서열만 읽느냐 두 개를 세트로 읽느냐에 따라 생김새가 조금 달라지고 SOLiD에서 사용하는 후자의 경우 다음과 같이 생겼다. 보면 맨 왼쪽에 있는 2.. [유전체 데이터 분석 내용 정리] 3-2. Next Generation Sequencing (NGS), short-read NGS (1) 목차 ◎ NGS의 등장 ◎ NGS 구분 ◎ short-read NGS (1) ◎ NGS의 등장 차세대 시퀀싱이라고도 불리는 NGS는 어떤 시퀀싱 기술을 특정하는 것이 아니라 생어 시퀀싱의 문제점인 low throughput을 극복한 high throuput seuqnecing 기술들을 총칭하는 말이다. 생어 시퀀싱과 달리 많은 수의, 다양한 종류의 DNA fragment들을 한 번에 처리할 수 있고, 그 특성 때문에 massive-parallel sequencing과도 같은 의미로 쓰인다. 2005년 454 Life Science의 pyrosequencing을 필두로 NGS의 시대가 도래했고, 속도와 가격, 그리고 성능의 발전 덕분에 whole exome, whole genome, whole transc.. [유전체 데이터 분석 내용 정리] 3-1. Sequencing - Sanger Sequencing (생어 시퀀싱) 목차 ◎ Sanger Sequencing (생어 시퀀싱) ◎ 생어 시퀀싱의 원리 ◎ 생어 시퀀싱의 장단점 ◎ Sanger Sequencing (생어 시퀀싱) 지난 [유전체 데이터 분석 내용 정리] 2. 유전체 데이터 분석 개요 (Genome Data Analysis) 에서 유전체 데이터 분석 과정 중 Sequencing (시퀀싱) 과정에서 뭘 하는지 간략하게 소개했다. 이번 글부터는 시퀀싱 방법으로는 어떤 것들이 사용되고, 과정과 특징이 어떤지를 짚어보려 한다. 가장 처음 소개 할 시퀀싱 방법은 생어 시퀀싱이다. 생어 시퀀싱은 1977년 Frederick Sanger (1918 - 2013) 에 의해 개발되었으며, 지금은 다양한 NGS 방법들에 의해 주류에서는 밀려났다. 하지만 Human Genome P.. [유전체 데이터 분석 내용 정리] 2. 유전체 데이터 분석 개요 (Genome Data Analysis) 목차 ◎ 오믹스? ◎ 유전체 데이터 분석 개요 ◎ 유전체 데이터 분석 결과 개요 ◎ 오믹스? 앞서 [유전체 데이터 분석 내용 정리] 1. 생명정보학 에서 '다중오믹스 정보'에 대해 언급했다. '다중오믹스 정보' 에서 다중은 '여러 가지' 라는 의미이고, '오믹스' 는 '체학' 을 의미한다. 체학은 집합체에 대한 연구를 의미하는데, 생물학 관련 체학으로는 유전체학, 전사체학, 단백체학 등이 있다. 그러니까 질병을 연구하는데 다중오믹스 데이터를 사용한다는 것은 유전체 데이터도 활용하고 전사체 데이터도 활용하고 단백체 데이터도 활용하고... 다 쓴다는 의미이다. 이 글에선 여러가지 체학 대상 중에서 유전체에 대해 얘기해보려 한다. 유전체는 유전자의 총체적인 특징을 의미하고, 이를 연구하기 시작한 건 왓슨과 크.. [유전체 데이터 분석 내용 정리] 1. 생명정보학 (Bioinformatics) 목차 ◎ '생명정보학 재밌을 것 같아!' ◎ '생명정보학'의 의미와 목적 ◎ '생명정보학 재밌을 것 같아!' 라고 생각한 뒤 전공을 선택해 공부를 조금씩 시작한게 얼마 지나지 않았는데, 벌써 졸업할 때가 다가온다. 생명정보학은 여전히 흥미롭고, 뭔가 패러다임을 바꿀 것만 같다고 생각하지만 (이미 바꾸고있지만 갤럭시 z-flip같은걸 보여줄 것만 같은, 더 큰 파장을 일으킬 것 같다) 한 편으론 생명공학을 전공하며 선택과목들로 공부하였기 때문인지 깊이도 부족하고, 알고있는 것들도 산재해 붕 뜬 느낌이다. 게다가 '정보학'이라는 단어만 떼어놓고보면 새삼 생소해 '내가 하는게 뭐지?' 같은 생각이 들 때도 있다. 또 누군가가 '생명정보학이 뭐야?' 아니면 '유전체 분석은 뭐하는거야?' 라 물어보면 쉽게 대답해.. 로그 스케일 로그 스케일은 도표상에 표시해야하는 숫자의 범위가 클 때 사용하면 좋은 표기법이다. 보통 축의 간격이 밑을 10으로하는 지수승으로 일정할 때 로그 스케일이라 한다 (0, 1, 2, 3...이 아니라 1, 10, 100, 1000...) 왜 로그 스케일이라는 이름이 붙었을까? 로그 스케일에선 축의 간격이 10의 지수승으로 일정하기 때문에, 1을 기준으로 만약 축 한 칸을 이동하면 $10^{1}$을, 축 두 칸을 이동하면 $10^{2}$을 의미하게 된다. 따라서 이동한 크기가 그 위치의 지수를 의미하고, 지수는 로그로 구하기 때문에 로그 스케일이란 이름이 붙은 것 같다. 로그 스케일 plot의 분류 2D plot을 기준으로 만약 plot의 한 축만 로그 스케일이면 그 plot은 semi-log plot이라 .. [공대생이라면 한 번쯤 들어보는... 1] 엔트로피 (2) 지난 [공대생이라면 한 번쯤 들어보는... 1] 엔트로피 (1)에서 엔트로피의 증가는 macrostate의 확률의 증가와 일맥상통한다고 했다. 이번 글에선 macrostate의 확률을 어떻게 계산할 수 있는지에 대해 알아보려 한다. macrostate는 microstate(들)로 이루어져있으니까, macrotate의 확률을 계산하려면 우선 microstate의 확률을 계산해야한다. 그렇다면 microstate의 확률은 어떻게 계산할 수 있을까? 이 고민에서 나온 개념이 Boltzmann distribution과 Boltzmann factor이다. Boltzmann distribution 하나의 microstate는 하나의 energy state에 대응할 수 있고, 그 energy state는 엔트로피로 .. [공대생이라면 한 번쯤 들어보는... 1] 엔트로피 (1) 이번 학기로 생명공학과 대학생으로서 들어야 하는 수업은 다 듣게 되는데, 그 수업 중 하나가 생물 물리학이다. 지난 학기에 생체 유체역학에 데인 적이 있어서 ('생체 유체역학'이 아니라 생체 '유체역학'이었던 과목이라 물리과가 된 기분이었다ㅠㅠ) 정말 안끌렸지만 전공 필수라 눈물을 머금고 신청했다. 개인적으로 물리를 싫어하진 않고, 또 아직까진 들을만 해서 생각한 것보다 고통스럽진 않다. 지금 배우고 있는 내용은 엔트로피의 통계역학적 해석인데, 말은 거창하지만 엔트로피를 통계적 시각으로 접근하는 것이라 잘 모르는 화학이나 열역학적인 내용이 없어서 좋다. 좋다는게 잘 안다는 의미는 아니지만...ㅎㅎ 공대 다니면서 언젠가 한번은 들었던 '엔트로피'인데 잘 모른다는게 조금 부끄럽기도 하고, 수업내용이기도 해서.. 이전 1 2 다음