KAIST 생명과학과동창회
  • News & Events
  • 생명과학의 역사를 쓰는 사람들 Research Highlights

생명과학의 역사를 쓰는 사람들 Research Highlights

Extra Form
인터뷰 김태묵
논문 Taemook Kim, Hogyu David Seo, Lothar Hennighausen, Daeyoup Lee, and Keunsoo Kang (2018), Octopus-toolkit: a workflow to automate mining of public epigenomic and transcriptomic next-generation sequencing data, Nucleic Acids Res. 2018 Feb 6. doi: 10.1093/nar/gky083, (PUBMED : https://www.ncbi.nlm.nih.gov/pubmed/29420797)
한줄요약 Next-generation sequencing data를 분석하기 위한 자동화 분석 툴킷


인터뷰

 

1. 논문 내용과 의미를 설명해 주세요.

   Next-Generation sequencing(NGS) 기술로 인해 최근 수년간 대규모의 Sequencing 데이터가 쌓여가고 있습니다. 많은 생물학을 연구하는 연구원들께서 이미 공개된 수많은 데이터를 이용하여 연구하고자 하는 목적에 맞게 더욱 더 유의미한 정보를 얻고자 노력하고 있습니다.

   하지만 대부분의 연구원들이 직접 데이터를 분석하는데 몇가지 어려움을 겪고 있습니다. 대부분의 NGS Tools Linux 기반으로 개발이 되어 있으며, GUI (Graphic user interface)가 아닌 CommandTool로 개발되어 있습니다. 사용자에게 익숙한 Window와 같이 파일을 열고 옵션을 선택한 뒤 클릭만으로 처리가 되는 것이 아니라 과거 Dos와 같이 직접 명령어를 하나하나 입력을 해야 되기 때문에 처음 시도 하시는 분들이 적응하는데 쉽지는 않습니다. 또한 NGS 관련 분석 Tools이 약 수 천개가 개발이 되어 있으며, ChIP-Seq, RNA-Seq 등등 하나의 분석을 하기 위해서도 관련된 Tool이 여러가지 필요합니다. (예시로 ChIp-Seq의 경우 약 10~12개의 Tool, 관련 Package 10개 필요)

   많은 연구원들이 익숙치 않은 운영체제에서 복잡한 설치 과정 및 실행 등 높은 진입장벽으로 인해 포기를 하는 경우를 많이 봤습니다. 이러한 문제점들을 해결하고 좀 더 쉽게 자신의 데이터를 분석하는데 도움이 되고자 개발은 진행하였습니다.

   제가 개발한 Octopus-toolkit은 분석과 관련된 여러가지 Tool을 자동으로 설치해주며, 클릭 몇 번만으로 NGS data를 분석을 처리해 줍니다. 또한 National Center for Biotechnology Information(NCBI) Published sequencing data의 경우 Accession Number(GSE,GSM)만 입력하여 분석을 할 수 있으며, 개인이 가지고 있는 데이터 또한 분석을 할 수 있습니다. ChIp-Seq, RNA-Seq, ATAC-Seq, DNase-seq, MNAse-seq, MeDIP-Seq을 처리할 수 있으며, 현재는 human (Homo sapiens), mouse (Mus musculus), dog (Canis lupus familiaris), plant (Arabidopsis thaliana), zebrafish (Danio rerio), fruit fly (Drosophila melanogaster), worm (Caenorhabditis elegans), and budding yeast (Saccharomyces cerevisiae) genomes을 대상으로 분석을 지원하고 있습니다.


figure.jpg

 

2. 연구과정에서 있었던 에피소드를 소개해 주세요.

   Octopus-toolkit NCBIPublished sequencing data를 처리하기 위하여 관련 정보들을 수집합니다. 올해 초 마지막 Revision을 하던 중 NCBI에서 Sequencing data에 대한 URL 및 사이트를 포맷을 변경을 하면서, 갑자기 프로그램의 기능 중 중요한 부분이 처리가 되지 않는 문제가 발생했습니다. 이미 여러가지 이유(리뷰어 요청 : Tools에 대한 추가 개발) Revision을 하던 중이어서 마지막에 Reject이 되지 않을까 하던 걱정을 하고 빠르게 수정을 해서 재배포를 하였는데, 다행히 에디터가 여행을 가는 바람에 리뷰어들에게 전달이 되지 않아 무사히 넘겼던 적이 있습니다.

 

3. 연구를 통해 얻은 지혜를 후배들에게 들려주세요.

   이 프로젝트()를 진행하면서 분명히 A라고 이해를 하고 진행을 하다가 다른 프로젝트()를 진행한 뒤 나중에 이 프로젝트()를 확인을 했을 때 B라고 이해를 하고 진행한 적이 있습니다. 몇일이 지나서 이상한 부분이 있어서 다시 앞에서부터 확인을 해보니 잘못 기억을 해서 진행하고 있던 것을 확인한 적이 있습니다. 실험실에서 이 프로젝트 하나만을 진행하는 것이 아니기 때문에, 매일 연구를 하고 분석을 한 내용들을 매번 잘 기록을 해 두는 것이 좋을 것 같습니다.

 

4. 나는 왜 명과학자가 되었는가?

   저는 학부과정을 컴퓨터를 전공하였고, 단순히 소프트웨어 개발을 하는 것이 아니라 생물학과 융합하여 제가 가지고 있는 능력을 좀 더 이쪽에서 발휘하고자 시작을 하였습니다. 공부를 하면서 세포 내에서 일어나는 많은 기작 등에 흥미를 느끼며, Bioinformatic에 흥미를 가져서 이를 연구하고 많은 궁금증을 해결하기 위해서 입니다.

 

5. 다른 하고 싶은 이야기

   이 논문을 쓰기까지 옆에서 관심 가져주시고 지도해주신 이대엽 교수님과 단국대학교 강근수 교수님께 감사 말씀드립니다. 그리고 실험실에서 오래 동안 있으면서 다들 건강 잘 챙기고, 하고 있는 연구에서 좋은 결과를 얻을 수 있기를 바랍니다.


  1. 손유경(생체분자공학 연구실, 김학성 교수님)

    1. 배경지식 세포 내외의 신호 전달 체계를 조절하는 것은 세포 및 단백질의 기능을 이해하는 기초적인 연구 및 질병 치료제를 개발하는데 있어서 매우 중요한 부분을 차지하고 있습니다. 현재까지는 세포 내로 진입하는 방법에 어려움이 있기 때문...
    Date2018.05.21 By생명과학과 Views46
    Read More
  2. 현광범(진핵세포 전사 연구실, 김재훈 교수님)

    <Rad5의 DNA replication fork reversal 모델> 1. 배경지식 다양한 DNA lesion은 replication fork를 stall할 수 있습니다. 이러한 stalling은 genome의 instability 와 cell death를 일으킬 수 있기 때문에, stalled replica...
    Date2018.05.14 By생명과학과 Views177
    Read More
  3. 김종원(생체분자공학 연구실, 김학성 교수님)

    <표적 특이적 유전자 전달 복합체의 구성 및 유전자 전달> 1. 배경지식 기존의 유전자 전달체는 바이러스성과 비바이러스성 전달체로 구분할 수 있습니다. 바이러스성 전달체는 높은 형질 발현율을 보이는 반면, 면역...
    Date2018.05.14 By생명과학과 Views118
    Read More
  4. 노수민(동물세포공학 실험실, 이균민 교수님)

    <GS/MSX시스템을 이용해서 바이오의약품 생산세포주를 만드는 과정> 1. 배경지식 바이오 의약품 (치료용 단백질, 재조합 단백질)을 생산하고자 할 때, 간단한 모양을 가진 단백질은 미생물이나 효모에서도 생산이 가능하지만 복잡한 형태...
    Date2018.05.09 By생명과학과 Views214
    Read More
  5. 김태윤(생체분자공학 연구실, 김학성 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 현재 사용되고 있는 대부분의 질병 치료제들은 항체에 기반하고 있습니다. 그러나 이러한 항체 기반의 치료들은 제작이 어려우며 제조비용도 매우 높습니다. 그래서 이러한 항체들을 대신할...
    Date2018.05.09 By생명과학과 Views180
    Read More
  6. 김륜희(시냅스뇌질환 연구실, 김은준 교수님)

    1. 논문 내용과 의미를 설명해 주세요. 뇌가 정상적으로 기능하기 위해선 다양한 molecular process를 통해 neuronal synapse가 잘 발달 되어야 합니다. 특히나, presynapse와 postsynapse 사이의 adhesive contact은 매우 중요한 단계이며 이 ...
    Date2018.04.30 By생명과학과 Views356
    Read More
  7. 황순규(시스템 및 합성생물학 연구실, 조병관 교수님)

    그림. 트랜스포존 시퀀싱 기법을 이용한 pyruvate transporter 유전자 기능 규명 1. 배경지식 Pyruvate 은 생명체에서 탄소원으로부터 에너지를 얻는 과정인 Central carbon metabolism 에서 glycolysis ...
    Date2018.04.30 By생명과학과 Views262
    Read More
  8. 문경환(신경발생학 연구실, 김진우 교수님)

     <Nf2는 각 구획의 세포분열 속도를 조절하는 스위치> 1. 연구를 시작한 계기 : 신경섬유종증을 앓고 있는 환자 중 많은 수가 안과 관련 질환을 가지고 있습니다. 이번 연구는 신경섬유종증의 원인이 되는 Nf2 유전자 돌연변이가 어떤 기작으...
    Date2018.04.30 By생명과학과 Views215
    Read More
  9. 최원영(분자종양유전학 연구실, 임대식 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. Hippo pathway의 effector protein인 YAP과 TAZ의 활성이 직접적으로 위암을 일으킬 수 있다는 것을 동물(마우스)모델로 증명하고, 분자적으로는 YAP activation이 MYC을 upregulation 하는 기전...
    Date2018.04.30 By생명과학과 Views168
    Read More
  10. 김태묵(크로마틴 연구실, 이대엽 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. Next-Generation sequencing(NGS) 기술로 인해 최근 수년간 대규모의 Sequencing 데이터가 쌓여가고 있습니다. 많은 생물학을 연구하는 연구원들께서 이미 공개된 수많은 데이터를 ...
    Date2018.04.23 By생명과학과 Views249
    Read More
  11. 박세근, 정용철, 김대건(행동유전학 실험실, 김대수 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 사람과 동물은 생존을 위한 먹이나 유용한 자원을 획득하기 위해 호기심을 갖고 다양한 사물을 탐색한다. 동물이 유용한 자원 혹은 먹이를 확보하려는 것은 생존을 위한 강력한 욕구이다. 인...
    Date2018.03.19 By생명과학과 Views530
    Read More
  12. 서호규(크로마틴 연구실, 이대엽 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요 이 논문은 제 직전 논문의 후속 연구논문입니다. 이전 논문에서 Proteasome이 fission yeast centromere에서 heterochromatin spreading을 막는 새로운 기능이 있다는 것을 밝혔고,...
    Date2018.03.13 By생명과학과 Views552
    Read More
  13. 서호규(크로마틴 연구실, 이대엽 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. Proteasome은 이름에서도 알 수 있듯이 수십 개의 단백질들로 구성되어 있는 복합체로서 세포 내 단백질들을 분해하는 기능으로 잘 알려져 있습니다. 체내 전체 단백질의 1%를 혼...
    Date2018.03.13 By생명과학과 Views518
    Read More
  14. 정선혜(세포분열분화발생 실험실, 임대식 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. Non-Alcoholic Fatty Liver Disease (NAFLD, 비알콜성지방간)/ Non-Alcoholic Steatohepatitis (NASH, 비알콜성지방간염)은 이름 그대로 알코올섭취와 상관없이 생기...
    Date2018.03.05 By생명과학과 Views619
    Read More
  15. 이민지(바이오이미징/광유전학 실험실, 허원도 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 세포는 외부 환경으로부터 오는 변화를 수용체를 통해서 인식하고, 그 신호를 세포 내부로 전달하는데, 이를 통해서 세포 내에서 여러 기능들이 조절됩니다. 이러한 수용체 중 TGF-...
    Date2018.02.05 By생명과학과 Views902
    Read More
  16. 변현종(카이스트 부설 한국과학영재학교 미생물공학실, 안정훈 교수님) - 카이스트 생명과학과 학부생

     ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 타입 I 분비 시스템(T1SS) 중 “폴리펩타이드를 수송하는 ABC 수송체”들의 단백질 분비 특성에 관해 연구한 논문입니다. 우리는 Pseudomonas fluorescens 박테리아가 보유한 ABC 수...
    Date2018.02.05 By생명과학과 Views636
    Read More
  17. 송요셉(시스템 및 합성 생물학 연구실, 조병관 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 화석연료는 에너지 연료로만 사용되는 것이 아니고, 정유시 발생하는 석유화학제품도 제약, 섬유 산업 등 다양한 분야에서 활용되고 있습니다. 화석연료 고갈 문제 및 사...
    Date2018.02.05 By생명과학과 Views579
    Read More
  18. 신정환(시스템신경과학 연구실, 정민환 교수님)

      ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 기저핵은 신경계에서 대표적으로 강화학습과 수의적인 운동에 중요한 부위로 알려져 있습니다. 강화학습이란 예측한 기대치 (Expected value)와 ...
    Date2018.01.29 By생명과학과 Views669
    Read More
  19. 유다영(동물세포공학 연구실, 이균민 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 현재 mammalian 세포에서 생산되는 단백질 의약품의 70%는 Chinese hamster ovary (CHO) 세포를 이용합니다. Glutamine synthetase (GS) / Methionine sulfoximine (MSX) 시스템은 CH...
    Date2018.01.29 By생명과학과 Views610
    Read More
  20. 정지혜(시스템 및 합성생물학 연구실, 조병관 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 단감의 경우 실제로 수확 후, 2주 후부터 연화가(물러짐) 진행되어 1달이 지나면 대부분의 단감이 연화되어 먹을 수 없습니다. 이렇듯 단감이 상품성을 가질 수 있는 기간은 한정적 ...
    Date2018.01.08 By생명과학과 Views696
    Read More
Board Pagination Prev 1 2 Next
/ 2