알림마당

  • 상담전화

    02-2123-4504

    업무시간.
    평일 09:00~18:00
    토,공휴일 휴무

홍보사항

[e-News Vol.1] 시퀀싱 데이터 활용 소개
작성자 관리자

 

 

f78be21b7cfaa840da5e5f724b62788a_1562916899_97.png 

시퀀싱 데이터 활용 소개

 작성자

 최은지(연세대학교) 

 유전체, 후성유전체 및 단일세포 전사체 데이터를 기반으로 임상 정보와 통합한 딥러닝 기반 분석 플랫폼 개발과 이를 이용한 대장암 특이적 마커를 발굴하는 목적으로서 본 사업단에서는 1차년도 2차년도에 걸쳐 다음과 같은 플랫폼의 sequencing 데이터를 생산하였습니다.

1.     860 (430 Normal[N]/430 Tumor[T]) 샘플의 Whole Genome Sequencing – short read sequencing

2.     435 (408N/427T) 샘플의 Whole Transcriptome Sequencing – short read sequencing

3.     75 (35N/35T) 샘플의 Targeted Panel Sequencing

4.     19 (11N/8T) 샘플의 Nanopore WGS

5.     78 (39N/39T) 샘플의 Nanopore WTS direct RNA

6.     50 (10N/40T) 샘플의 Hi-C

7.     60 (30N/30T) 샘플의 Chip-seq

 위와 같은 데이터가 생산되었으며 이를 토대로 integrative analyses 및 deep learning을 통한 diagnostic biomarker와 prognostic biomarker를 발굴하고자 합니다.  

 Whole Genome Sequencing을 통한 대규모 병렬형 염기서열 분석을 통해서, 환자의 유전체 정보를 얻을 수 있습니다. 암 특이적인 Structural variation, noncoding variant, coding variant, insertion, deletion, copy number alteration, expression changes, methylation change, MSI status등의 factor clinical factor와 대조 분석하여 clinical significance를 가지는 factor를 선정에 활용될 데이터입니다.

 Illumina sequencer를 통해 세포 조직 내에 존재하는 모든 RNA의 염기서열을 읽은 whole Transcriptome sequencing 데이터는 세포 내에서 일어나는 전사체의 변화를 확인할 수 있는 방법입니다. RNA는 크게 단백질 생성 유무에 따라 coding noncoding으로 분류할 수 있으며, 최근 연구들을 통해 noncoding RNA의 조절 기능의 중요성이 부각됨에 따라 total RNA sequencing을 진행하여 모든 종류의 RNA을 확인하였습니다. RNA-seq을 통해 조직 내에서 발현되고 있는 유전자의 양을 확인할 수 있고, 이를 통해 정상 조직과 암 환자에서의 발현 차이를 보이는 유전자를 확인할 수 있습니다. 또한 각종 다중 유전체 분석을 통해 발견한 요인들은 실제 유전자 발현에 미치는 영향을 확인하고자 할 때 사용되는 데이터입니다.

 Targeted Panel Sequencing은 특정 암 종 연구에서 빈번하게 발견된 유전적 변이의 정보를 기반으로, 유전체 전부를 Sequencing하는 WGS과 다르게 암 또는 질병과 관련이 있을 것으로 추정되는 유전자에 Amplicon 또는 Hybridization-Capture를 활용한 Sequencing 하는 기술로서 적은 양의 DNA의 사용으로도 데이터 생산이 가능하며, 생산되는 데이터는 높은 Coverage를 확보할 수 있기 때문에 종양 내에 존재하는 rare한 변이를 발견하는데 유용합니다. 다른 플랫폼에 비해 결과를 확인하기 위한 비용과 시간 측면에서 매우 효율적이기 때문에 임상 적용에 가장 적절한 기술입니다.

 Oxford Nanopore Technology(ONT) Nanopore sequencing DNA/RNA 분자가 Nanopore 단백질을 통과할 때 발생하는 전류의 변화를 분석하는 원리의 염기서열 결정법으로, 긴 길이의 DNA/RNA를 한번에 sequencing하여 long read data를 생산합니다. 최대 2Mb DNA 조각을 sequencing 하며, raw gDNA RNAsequencing 할 경우 염기 변형(base modification) 확인을 통해 후성유전체(epigenome) 및 후성전사체(epitranscriptome)을 분석이 가능합니다. Long read 시퀀싱의 특성상 WGS 분석을 통해 민감도 높은 구조변이 분석이 가능하며, 반복서열지역의 변이 분석, 복잡한 구조변이의 재구성이 가능하고, 변이 동조화 분석을 통해 변이의 영향에 대한 정확한 분석이 가능합니다. 더불어 DNA methylation hydroxymethylation 분석을 통해 후성유전학적인 조절기전 분석이 가능합니다. 또한 long-read WTS를 이용하여 Transcript의 정확한 구조를 확인하여, novel isoform fusion gene 발견 가능하며 RNA modification 분석이 가능합니다또한 기존 암유전체 연구에서 chromatin remodeler를 비롯 후성 유전적 유전자 조절에 관여하는 여러 인자들에 빈번한 체세포 돌연변이가 보고되었기에, Hi-CChip-seq 데이터를 이용하여 암 특이적인 후성유전체 패턴 규명은 암의 발병 기전을 이해하는데 중요함 정보를 제공할 것입니다.


f78be21b7cfaa840da5e5f724b62788a_1562917110_04.png

 

 

댓글목록

등록된 댓글이 없습니다.

  • 상담전화

    02-2123-4504

    업무시간.
    평일 09:00~18:00
    토,공휴일 휴무