Deconvolution
이란 bulk로 샘플링 되어 전사체 시퀀싱 (RNA-seq)을 수행한 데이터로부터 유전자 발편 패턴을 기반으로 샘플 내 개별 세포들의 비율을 예측하는 분석임. Deconvolution을 수행하기 위해 bulk RNA-seq과 타겟하는 세포들의 유전자 발현 패턴에 해당하는 signature 가 필요하며 이들의 데이터는 matrix 형태로 존재함 그림 1. Deconvolution 알고리즘 개요 본 연구는 정상인 및 암 환자에서 얻은 RNA-seq데이터를 기반으로 면역세포의 분포를 예측하는 알고리즘 개발을 목표로 하며 그림 1과 같이 public 데이터와 함께 대장암 RNA-seq 데이터와ground truth에 해당하는 single-cell RNA-seq데이터를 통해 혈액 내 면역세포의 비율을 에측하는 neural network를 구축함
그림 2. Deconvolution 알고리즘 및 성능 확인
그림 2와 같이 neural network에 대장암 bulk RNA-seq과 scRNA-seq 데이터를 input으로 데이터를 학습한 후 별도의 test 데이터로 성능을 확인하여 알고리즘의 정확도를 평가함. 본 연구를 통해 deep learning을 deconvolution에 적용함으로써 기존 deconvolution 알고리즘의 한계를 극복하고 정상 샘플과 대장암 샘플의 혈액 내 면역세포의 비율 및 영향을 확인하고자함. |