KAIST 생명과학과동창회
  • News & Events
  • 생명과학의 역사를 쓰는 사람들 Research Highlights

생명과학의 역사를 쓰는 사람들 Research Highlights

Extra Form
인터뷰 김태묵
논문 Taemook Kim, Hogyu David Seo, Lothar Hennighausen, Daeyoup Lee, and Keunsoo Kang (2018), Octopus-toolkit: a workflow to automate mining of public epigenomic and transcriptomic next-generation sequencing data, Nucleic Acids Res. 2018 Feb 6. doi: 10.1093/nar/gky083, (PUBMED : https://www.ncbi.nlm.nih.gov/pubmed/29420797)
한줄요약 Next-generation sequencing data를 분석하기 위한 자동화 분석 툴킷


인터뷰

 

1. 논문 내용과 의미를 설명해 주세요.

   Next-Generation sequencing(NGS) 기술로 인해 최근 수년간 대규모의 Sequencing 데이터가 쌓여가고 있습니다. 많은 생물학을 연구하는 연구원들께서 이미 공개된 수많은 데이터를 이용하여 연구하고자 하는 목적에 맞게 더욱 더 유의미한 정보를 얻고자 노력하고 있습니다.

   하지만 대부분의 연구원들이 직접 데이터를 분석하는데 몇가지 어려움을 겪고 있습니다. 대부분의 NGS Tools Linux 기반으로 개발이 되어 있으며, GUI (Graphic user interface)가 아닌 CommandTool로 개발되어 있습니다. 사용자에게 익숙한 Window와 같이 파일을 열고 옵션을 선택한 뒤 클릭만으로 처리가 되는 것이 아니라 과거 Dos와 같이 직접 명령어를 하나하나 입력을 해야 되기 때문에 처음 시도 하시는 분들이 적응하는데 쉽지는 않습니다. 또한 NGS 관련 분석 Tools이 약 수 천개가 개발이 되어 있으며, ChIP-Seq, RNA-Seq 등등 하나의 분석을 하기 위해서도 관련된 Tool이 여러가지 필요합니다. (예시로 ChIp-Seq의 경우 약 10~12개의 Tool, 관련 Package 10개 필요)

   많은 연구원들이 익숙치 않은 운영체제에서 복잡한 설치 과정 및 실행 등 높은 진입장벽으로 인해 포기를 하는 경우를 많이 봤습니다. 이러한 문제점들을 해결하고 좀 더 쉽게 자신의 데이터를 분석하는데 도움이 되고자 개발은 진행하였습니다.

   제가 개발한 Octopus-toolkit은 분석과 관련된 여러가지 Tool을 자동으로 설치해주며, 클릭 몇 번만으로 NGS data를 분석을 처리해 줍니다. 또한 National Center for Biotechnology Information(NCBI) Published sequencing data의 경우 Accession Number(GSE,GSM)만 입력하여 분석을 할 수 있으며, 개인이 가지고 있는 데이터 또한 분석을 할 수 있습니다. ChIp-Seq, RNA-Seq, ATAC-Seq, DNase-seq, MNAse-seq, MeDIP-Seq을 처리할 수 있으며, 현재는 human (Homo sapiens), mouse (Mus musculus), dog (Canis lupus familiaris), plant (Arabidopsis thaliana), zebrafish (Danio rerio), fruit fly (Drosophila melanogaster), worm (Caenorhabditis elegans), and budding yeast (Saccharomyces cerevisiae) genomes을 대상으로 분석을 지원하고 있습니다.


figure.jpg

 

2. 연구과정에서 있었던 에피소드를 소개해 주세요.

   Octopus-toolkit NCBIPublished sequencing data를 처리하기 위하여 관련 정보들을 수집합니다. 올해 초 마지막 Revision을 하던 중 NCBI에서 Sequencing data에 대한 URL 및 사이트를 포맷을 변경을 하면서, 갑자기 프로그램의 기능 중 중요한 부분이 처리가 되지 않는 문제가 발생했습니다. 이미 여러가지 이유(리뷰어 요청 : Tools에 대한 추가 개발) Revision을 하던 중이어서 마지막에 Reject이 되지 않을까 하던 걱정을 하고 빠르게 수정을 해서 재배포를 하였는데, 다행히 에디터가 여행을 가는 바람에 리뷰어들에게 전달이 되지 않아 무사히 넘겼던 적이 있습니다.

 

3. 연구를 통해 얻은 지혜를 후배들에게 들려주세요.

   이 프로젝트()를 진행하면서 분명히 A라고 이해를 하고 진행을 하다가 다른 프로젝트()를 진행한 뒤 나중에 이 프로젝트()를 확인을 했을 때 B라고 이해를 하고 진행한 적이 있습니다. 몇일이 지나서 이상한 부분이 있어서 다시 앞에서부터 확인을 해보니 잘못 기억을 해서 진행하고 있던 것을 확인한 적이 있습니다. 실험실에서 이 프로젝트 하나만을 진행하는 것이 아니기 때문에, 매일 연구를 하고 분석을 한 내용들을 매번 잘 기록을 해 두는 것이 좋을 것 같습니다.

 

4. 나는 왜 명과학자가 되었는가?

   저는 학부과정을 컴퓨터를 전공하였고, 단순히 소프트웨어 개발을 하는 것이 아니라 생물학과 융합하여 제가 가지고 있는 능력을 좀 더 이쪽에서 발휘하고자 시작을 하였습니다. 공부를 하면서 세포 내에서 일어나는 많은 기작 등에 흥미를 느끼며, Bioinformatic에 흥미를 가져서 이를 연구하고 많은 궁금증을 해결하기 위해서 입니다.

 

5. 다른 하고 싶은 이야기

   이 논문을 쓰기까지 옆에서 관심 가져주시고 지도해주신 이대엽 교수님과 단국대학교 강근수 교수님께 감사 말씀드립니다. 그리고 실험실에서 오래 동안 있으면서 다들 건강 잘 챙기고, 하고 있는 연구에서 좋은 결과를 얻을 수 있기를 바랍니다.


  1. 김태묵(크로마틴 연구실, 이대엽 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. Next-Generation sequencing(NGS) 기술로 인해 최근 수년간 대규모의 Sequencing 데이터가 쌓여가고 있습니다. 많은 생물학을 연구하는 연구원들께서 이미 공개된 수많은 데이터를 ...
    Date2018.04.23 By생명과학과 Views1473
    Read More
  2. 박세근, 정용철, 김대건(행동유전학 실험실, 김대수 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 사람과 동물은 생존을 위한 먹이나 유용한 자원을 획득하기 위해 호기심을 갖고 다양한 사물을 탐색한다. 동물이 유용한 자원 혹은 먹이를 확보하려는 것은 생존을 위한 강력한 욕구이다. 인...
    Date2018.03.19 By생명과학과 Views2003
    Read More
  3. 서호규(크로마틴 연구실, 이대엽 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요 이 논문은 제 직전 논문의 후속 연구논문입니다. 이전 논문에서 Proteasome이 fission yeast centromere에서 heterochromatin spreading을 막는 새로운 기능이 있다는 것을 밝혔고,...
    Date2018.03.13 By생명과학과 Views1206
    Read More
  4. 서호규(크로마틴 연구실, 이대엽 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. Proteasome은 이름에서도 알 수 있듯이 수십 개의 단백질들로 구성되어 있는 복합체로서 세포 내 단백질들을 분해하는 기능으로 잘 알려져 있습니다. 체내 전체 단백질의 1%를 혼...
    Date2018.03.13 By생명과학과 Views1542
    Read More
  5. 정선혜(세포분열분화발생 실험실, 임대식 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. Non-Alcoholic Fatty Liver Disease (NAFLD, 비알콜성지방간)/ Non-Alcoholic Steatohepatitis (NASH, 비알콜성지방간염)은 이름 그대로 알코올섭취와 상관없이 생기...
    Date2018.03.05 By생명과학과 Views2367
    Read More
  6. 이민지(바이오이미징/광유전학 실험실, 허원도 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 세포는 외부 환경으로부터 오는 변화를 수용체를 통해서 인식하고, 그 신호를 세포 내부로 전달하는데, 이를 통해서 세포 내에서 여러 기능들이 조절됩니다. 이러한 수용체 중 TGF-...
    Date2018.02.05 By생명과학과 Views1587
    Read More
  7. 변현종(카이스트 부설 한국과학영재학교 미생물공학실, 안정훈 교수님) - 카이스트 생명과학과 학부생

     ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 타입 I 분비 시스템(T1SS) 중 “폴리펩타이드를 수송하는 ABC 수송체”들의 단백질 분비 특성에 관해 연구한 논문입니다. 우리는 Pseudomonas fluorescens 박테리아가 보유한 ABC 수...
    Date2018.02.05 By생명과학과 Views1253
    Read More
  8. 송요셉(시스템 및 합성 생물학 연구실, 조병관 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 화석연료는 에너지 연료로만 사용되는 것이 아니고, 정유시 발생하는 석유화학제품도 제약, 섬유 산업 등 다양한 분야에서 활용되고 있습니다. 화석연료 고갈 문제 및 사...
    Date2018.02.05 By생명과학과 Views1183
    Read More
  9. 신정환(시스템신경과학 연구실, 정민환 교수님)

      ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 기저핵은 신경계에서 대표적으로 강화학습과 수의적인 운동에 중요한 부위로 알려져 있습니다. 강화학습이란 예측한 기대치 (Expected value)와 ...
    Date2018.01.29 By생명과학과 Views2517
    Read More
  10. 유다영(동물세포공학 연구실, 이균민 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 현재 mammalian 세포에서 생산되는 단백질 의약품의 70%는 Chinese hamster ovary (CHO) 세포를 이용합니다. Glutamine synthetase (GS) / Methionine sulfoximine (MSX) 시스템은 CH...
    Date2018.01.29 By생명과학과 Views3022
    Read More
  11. 정지혜(시스템 및 합성생물학 연구실, 조병관 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 단감의 경우 실제로 수확 후, 2주 후부터 연화가(물러짐) 진행되어 1달이 지나면 대부분의 단감이 연화되어 먹을 수 없습니다. 이렇듯 단감이 상품성을 가질 수 있는 기간은 한정적 ...
    Date2018.01.08 By생명과학과 Views1169
    Read More
  12. 조유리(분자세포면역학 연구실, 강석조 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해주세요. 2011년 Ralph Steinman이 Dendritic cell의 발견을 한 공로로 노벨 생리의학상을 수상하였습니다. 그 만큼 Dendritic cell은 우리 면역 시스템에 굉장히 중요한 면역 세포입니다. I...
    Date2018.01.03 By생명과학과 Views2426
    Read More
  13. 김희연 (생체분자공학 연구실, 김학성 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 생물의약품이 세포 내로 전달되어 약효를 나타내기 위해서는, 일반적으로 선택적인 투과성을 지닌 세포막을 잘 투과할 수 있도록 디자인 되어야...
    Date2017.12.29 By생명과학과 Views1937
    Read More
  14. 김종원 (생체분자공학 연구실, 김학성 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 현재 민감도와 특이성이 높은 표적 물질의 검출 및 분석법이 다양하게 개발되고 있습니다. 대개는 신호 발생 물질인 효소를 나노입자나 항체에 화학적 결합을 통해 이용하고 ...
    Date2017.12.27 By생명과학과 Views984
    Read More
  15. 최정윤 (발생분화연구실, 한용만 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. CFC 증후군은 ERK 신호전달체계의 돌연변이에 의해 발생하는 희귀 유전 질환입니다. 비정상적인 뼈 발달은 대부분의 CFC 증후군 환자에서 나타나지만 ERK 신호전달체계의 이상과 골...
    Date2017.12.11 By생명과학과 Views1361
    Read More
  16. 김나연(바이오이미징/광유전학 실험실, 허원도 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. Protein oligomerization is an important molecular mechanism in many biological processes that control numerous cellular events. We investigated the property of crypt...
    Date2017.11.13 By생명과학과 Views1539
    Read More
  17. 유미란(신경회로망 연구실, 한진희 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 기억이 어떻게 형성 되어서, 어떻게 평생에 거쳐 저장되고 유지될 수 있을지를 밝히는 것은 매우 흥미로운 일입니다. 처음 획득한 기억이 안정화 되기 위해서는 기억에 중요한 여...
    Date2017.10.30 By생명과학과 Views2024
    Read More
  18. 전종철(진핵세포 전사 연구실, 김재훈 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. DNA 와 함께 크로마틴을 구성하고 있는 히스톤은 다양한 종류의 post-translational modification 에 의해 조절됩니다. 히스톤 H3 의 4 번째 lysine 잔기 (H3K4) methylation 은 대표적...
    Date2017.10.30 By생명과학과 Views1731
    Read More
  19. 천영서(크로마틴 생물학 연구실, 이대엽 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. Centromere의 특징 중 하나는 전형적인 histone H3 nucleosome 대신 centromere-specific histone H3 variant인 CENP-A nucleosome이 존재한다는 점입니다. 이러한 CENP-A nucleoso...
    Date2017.10.25 By생명과학과 Views2947
    Read More
  20. 이동윤(바이오나노의약 실험실, 전상용 교수님)

    ▷인터뷰 1. 논문 내용과 의미를 설명해 주세요. 황달 유발의 주요 물질이자 간 질환의 지표로 사용되어 온 빌리루빈은 다른 한편으로는 많은 염증 질환을 조절할 수 있는 체 내의 강력한 항산화제로 밝혀져 큰 주목을 받아 왔...
    Date2017.10.24 By생명과학과 Views1517
    Read More
Board Pagination Prev 1 2 3 Next
/ 3