▷인터뷰
1. 논문 내용과 의미를 설명해 주세요.
Next-Generation sequencing(NGS) 기술로 인해 최근 수년간 대규모의 Sequencing 데이터가 쌓여가고 있습니다. 많은 생물학을 연구하는 연구원들께서 이미 공개된 수많은 데이터를 이용하여 연구하고자 하는 목적에 맞게 더욱 더 유의미한 정보를 얻고자 노력하고 있습니다.
하지만 대부분의 연구원들이 직접 데이터를 분석하는데 몇가지 어려움을 겪고 있습니다. 대부분의 NGS Tools은 Linux 기반으로 개발이 되어 있으며, GUI (Graphic user interface)가 아닌 Command형 Tool로 개발되어 있습니다. 사용자에게 익숙한 Window와 같이 파일을 열고 옵션을 선택한 뒤 클릭만으로 처리가 되는 것이 아니라 과거 Dos와 같이 직접 명령어를 하나하나 입력을 해야 되기 때문에 처음 시도 하시는 분들이 적응하는데 쉽지는 않습니다. 또한 NGS 관련 분석 Tools이 약 수 천개가 개발이 되어 있으며, ChIP-Seq, RNA-Seq 등등 하나의 분석을 하기 위해서도 관련된 Tool이 여러가지 필요합니다. (예시로 ChIp-Seq의 경우 약 10~12개의 Tool, 관련 Package 10개 필요)
많은 연구원들이 익숙치 않은 운영체제에서 복잡한 설치 과정 및 실행 등 높은 진입장벽으로 인해 포기를 하는 경우를 많이 봤습니다. 이러한 문제점들을 해결하고 좀 더 쉽게 자신의 데이터를 분석하는데 도움이 되고자 개발은 진행하였습니다.
제가 개발한 Octopus-toolkit은 분석과 관련된 여러가지 Tool을 자동으로 설치해주며, 클릭 몇 번만으로 NGS data를 분석을 처리해 줍니다. 또한 National Center for Biotechnology Information(NCBI)에 Published sequencing data의 경우 Accession Number(GSE,GSM)만 입력하여 분석을 할 수 있으며, 개인이 가지고 있는 데이터 또한 분석을 할 수 있습니다. ChIp-Seq, RNA-Seq, ATAC-Seq, DNase-seq, MNAse-seq, MeDIP-Seq을 처리할 수 있으며, 현재는 human (Homo sapiens), mouse (Mus musculus), dog (Canis lupus familiaris), plant (Arabidopsis thaliana), zebrafish (Danio rerio), fruit fly (Drosophila melanogaster), worm (Caenorhabditis elegans), and budding yeast (Saccharomyces cerevisiae) genomes을 대상으로 분석을 지원하고 있습니다.
2. 연구과정에서 있었던 에피소드를 소개해 주세요.
Octopus-toolkit은 NCBI에 Published sequencing data를 처리하기 위하여 관련 정보들을 수집합니다. 올해 초 마지막 Revision을 하던 중 NCBI에서 Sequencing data에 대한 URL 및 사이트를 포맷을 변경을 하면서, 갑자기 프로그램의 기능 중 중요한 부분이 처리가 되지 않는 문제가 발생했습니다. 이미 여러가지 이유(리뷰어 요청 : Tools에 대한 추가 개발)로 Revision을 하던 중이어서 마지막에 Reject이 되지 않을까 하던 걱정을 하고 빠르게 수정을 해서 재배포를 하였는데, 다행히 에디터가 여행을 가는 바람에 리뷰어들에게 전달이 되지 않아 무사히 넘겼던 적이 있습니다.
3. 연구를 통해 얻은 지혜를 후배들에게 들려주세요.
이 프로젝트(가)를 진행하면서 분명히 A라고 이해를 하고 진행을 하다가 다른 프로젝트(나)를 진행한 뒤 나중에 이 프로젝트(가)를 확인을 했을 때 B라고 이해를 하고 진행한 적이 있습니다. 몇일이 지나서 이상한 부분이 있어서 다시 앞에서부터 확인을 해보니 잘못 기억을 해서 진행하고 있던 것을 확인한 적이 있습니다. 실험실에서 이 프로젝트 하나만을 진행하는 것이 아니기 때문에, 매일 연구를 하고 분석을 한 내용들을 매번 잘 기록을 해 두는 것이 좋을 것 같습니다.
4. 나는 왜 생명과학자가 되었는가?
저는 학부과정을 컴퓨터를 전공하였고, 단순히 소프트웨어 개발을 하는 것이 아니라 생물학과 융합하여 제가 가지고 있는 능력을 좀 더 이쪽에서 발휘하고자 시작을 하였습니다. 공부를 하면서 세포 내에서 일어나는 많은 기작 등에 흥미를 느끼며, Bioinformatic에 흥미를 가져서 이를 연구하고 많은 궁금증을 해결하기 위해서 입니다.
5. 다른 하고 싶은 이야기
이 논문을 쓰기까지 옆에서 관심 가져주시고 지도해주신 이대엽 교수님과 단국대학교 강근수 교수님께 감사 말씀드립니다. 그리고 실험실에서 오래 동안 있으면서 다들 건강 잘 챙기고, 하고 있는 연구에서 좋은 결과를 얻을 수 있기를 바랍니다.