목차
◎ '생명정보학 재밌을 것 같아!'
◎ '생명정보학'의 의미와 목적
◎ '생명정보학 재밌을 것 같아!'
라고 생각한 뒤 전공을 선택해 공부를 조금씩 시작한게 얼마 지나지 않았는데, 벌써 졸업할 때가 다가온다. 생명정보학은 여전히 흥미롭고, 뭔가 패러다임을 바꿀 것만 같다고 생각하지만 (이미 바꾸고있지만 갤럭시 z-flip같은걸 보여줄 것만 같은, 더 큰 파장을 일으킬 것 같다) 한 편으론 생명공학을 전공하며 선택과목들로 공부하였기 때문인지 깊이도 부족하고, 알고있는 것들도 산재해 붕 뜬 느낌이다.
게다가 '정보학'이라는 단어만 떼어놓고보면 새삼 생소해 '내가 하는게 뭐지?' 같은 생각이 들 때도 있다. 또 누군가가 '생명정보학이 뭐야?' 아니면 '유전체 분석은 뭐하는거야?' 라 물어보면 쉽게 대답해줄 자신이 없다. '타인에게 쉽게 설명할 수 없으면, 제대로 이해하지 못한것이다' 라는 말 처럼, 내가 생각해도 나는 생명정보학에 대해, 그리고 유전체 데이터 분석에 대해 제대로 이해하지 못하고 있다. 그런 멍한 상태에서 탈피하기 위해, [유전체 데이터 분석 내용 정리] 라는 주제로 지금까지 배워온 것들에 대해 정리해보려 한다.
◎ '생명정보학'의 의미와 목적
'정보학'은 정보 (data) 를 추출, 저장, 전송, 분석하여 인사이트를 얻어내는 것에 대한 학문이다. 이 정보학이 생물학과 결합하게 된 원인에는 생물학과 컴퓨터의 발전이 있다.
현미경, 생화학, 세포&분자 생물학, 진단검사 등의 발전으로 생물학적 정보는 분자수준의 미시적 정보까지 포함하게 됐다. 특히 유전물질의 정체가 염기서열로 이루어진 코돈임이 밝혀지면서, 생물학도 정보학의 성격을 띌 수 있음이 밝혀졌고, 생어 시퀀싱이 고안되면서 DNA 정보들이 터져나오기 시작했다. 30억쌍의 염기쌍으로 이루어진 유전체를 다양한 사람들에 대해 분석하려하니 당연히 양이 방대했고, 자연스레 컴퓨터와 통계학이 접목되어 지금과 같은 형태의 생명정보학으로 자리잡게되었다. 정리하자면 생명정보학은 생물체로부터 얻어진 대량의 데이터로부터 유용한 지식을 얻어내기 위한 이론물리/전산/통계/수학적인 도구를 이용하여 생명현상을 연구하는 분야를 의미하고있다. 그 분야로는 서열정렬, 유전자 검색, 유전자 조합, 단백질 구조 정렬, 단백질 구조 예측, 유전자발현의 예측, 단백질간 상호작용, 진화모델 등 다양하다.
앞서 말한 분야들을 포괄하는 생명정보학이 점점 대두되는 이유는, 이를 통해 뽑아내려는 인사이트에는 생물학적 기전 뿐만이 아니라 질병의 원인이 있기 때문이다. 암과 같은 유전 질환으로 구분되는 질병들에 대해 유전체의 어떤 부위가 어떤식으로 참조 데이터와 다를 때 질병이 발생하는지 연구할 수 있고, 요즘은 유전 질환을 넘어 만성 질환까지 다중체정보 (다중오믹스 정보)와 AI를 활용해 연구중에 있다. 이러한 연구들은 미래의학을 가능케하기 때문에 중요하다. 미래의학은 P4의학이라고도 불리는데, Predictive (예측), Preventive (예방), Personalized (맞춤), Participatory (참여)의 의미이다. 요약하자면 환자 맞춤의 (환자 한명 한명 맞춤형 진단을 제공하는 것은 좀 과장이라 요즘은 정밀의학이라는 말을 쓰지만, 어쨌든 기존의 범위보다는 확연히 좁혀진다) 예측 및 예방 가능한 의학을 제공하는것이 핵심인데, 이는 현재의 대응 중심의 의학과는 완전히 다른 패러다임이다. 개인화된 맞춤 의학을 위해선 개인의 생물학적 속성이 계측, 분석돼야하므로 그 핵심에는 생명정보학이 위치한다.
정보학 측면에서 생각할 때, 내가 집중하려는 분야는 '분석'이다. 물론 앞서 말한 미래의학을 실현하려면 어떻게 정보를 추출하고 (스마트 폰의 활용 등), 어떻게 정보를 저장할 것이며 (국가? 개인?), 어디까지 허용할 것인지 (프라이버시), 어떤 정보와 결합할 것인지 (life-log) 등 많은 논의가 오가야 가능하지만, 유전적&생물학적 특성과 질병의 연관성을 밝혀놓는 것이 둘째 가라면 서러운 핵심이라 생각한다. 그 핵심을 능수능란하게 다룰 만큼 똑똑한 것도 아니고, 배울게 한참 남았지만, 조금이나마 이해하고 또 이바지하면 조금은 의미있게 살았다고 스스로를 다독일 수 있을 것 같아 열심히 해보려 한다.
여기까지가 내가 이해한 생명정보학의 정의와 의의, 그리고 내가 하고싶은 분야에 대한 정리이다. 다음으로는 유전체 데이터에 대해 얘기해보려 한다.
[참고자료]
https://ko.wikipedia.org/wiki/%EC%83%9D%EB%AC%BC%EC%A0%95%EB%B3%B4%ED%95%99
생물정보학 - 위키백과, 우리 모두의 백과사전
생물정보학(生物情報學), 흔히 바이오인포매틱스(bioinformatics)는 생물학적인 문제를 응용수학, 정보과학, 통계학, 컴퓨터 과학, 인공지능, 화학, 생화학등을 이용하여 주로 분자 수준에서 다루는
ko.wikipedia.org
http://www.kyobobook.co.kr/product/detailViewKor.laf?mallGb=KOR&ejkGb=KOR&barcode=9791159431876
유전체 데이터 분석. 2: NGS편, 암과 질병 유전체 - 교보문고
“미래를 예측하는 최고의 방법은 우리가 미래를 발명해버리는 것이다.”- 알란 케이바이오인포매틱스라는 낯설고 긴 이름의 학문이 국내에 소개된 지도 20여 년이 흘렀다. 초기의 서열 정렬과
www.kyobobook.co.kr
'생명공학' 카테고리의 다른 글
[유전체 데이터 분석 내용 정리] 3-1. Sequencing - Sanger Sequencing (생어 시퀀싱) (0) | 2021.09.07 |
---|---|
[유전체 데이터 분석 내용 정리] 2. 유전체 데이터 분석 개요 (Genome Data Analysis) (0) | 2021.09.03 |
로그 스케일 (0) | 2021.04.26 |
[공대생이라면 한 번쯤 들어보는... 1] 엔트로피 (2) (0) | 2021.04.08 |
[공대생이라면 한 번쯤 들어보는... 1] 엔트로피 (1) (0) | 2021.04.08 |