학부연구생/Projects

scRNA | scRNA Data EDA

noweahct 2024. 12. 25. 16:01

발표 날짜: 2024.03.22, 2024.05.03


Data

A single-cell transcriptome atlas of the human pancreas [CEL-seq2]

Single-cell RNA sequencing of pancreatic islets from 4 human donors and 2 mice strains

  • organisms: homo sapiens, mus musculus
    • human 1: 1937*20128,  human 2: 1724*20128, human 3: 3605*20128, human 4: 1303*20128,
    • mice 1: 822*14881, mice 2: 1064*14881
  • Columns: Unnamed: 0 (individual pancreatic cells), barcode (RNA, uniquely identify each cell), assigned_cluster (cell type), genes(PCBP2, MTUS1, GOLGB1, EML5…)
    •  human’s cell type: ['ductal' 'delta' 'alpha' 'activated_stellate' 'beta' 'macrophage' 'quiescent_stellate' 'acinar’ 'gamma’   'epsilon' 'endothelial' 't_cell' 'mast' 'schwann’] -> 14
    •   mouse’s cell type: ['beta' 'ductal' 'delta' 'schwann' 'quiescent_stellate' 'endothelial' 'gamma' 'alpha’   'macrophage’   'immune_other' 'activated_stellate' 'B_cell' 'T_cell’] -> 13

Data 예시


PCA


Cell Type 분포 비교


사람과 쥐의 공통 유전자 추출


Barcode

- 10X GenomicsBD Rhapsody와 같은 scRNA sequencing 기술을 사용하면 mRNA poli-A tail을 캡처하는 데 의존한다.

*** mRNA: 화학적으로 암호화된 단백질을 생산하는 데 설계도 같은 역할을 하는 RNA의 한 종류

- mRNA 캡처하는 데 사용하는 sequence: barcodeUMI
- Barcode: short nucleotide tags that are used to "label" sequences
- Labelsingle cell에서 나온 sequence 분류하거나, 특정 세포 표면의 단백질처럼 세포의 특징을 표시하는 데 사용된다.

 

Cell Barcode

- 동일한 cell barcode가 있는 sequence는 동일한 cell source에서 나온 것으로, 함께 그룹화할 수 있다.

Feature Barcode

- 세포 표면 단백질의 존재를 나타내는 additional tag

- cell surface target에 대한 항체에 연결되어 있고, feature barcodecell barcode 포함하고 있는 bead에 대한 capture 통해 cell barcode에 할당된다.

 

K-mer

- substrings of length k contained within a biological sequence

    -> 어떤 sequence에서 feature 뽑을 때, k-mer 사용할 수 있다.

- Composed of nucleotides (A, T, G, C,,)
- 같은 barcode 가진 cell들은 유사한 k-mer 패턴을 공유하는 경향이 있고, 이를 통해 barcode 간의 유사성을 비교하고 barcode 특정 그룹으로 분류할 수 있다.


Self-Feedback

Barcode에 대한 분석 및 해석

1. barcode 중간에 위치한 “-” 의 의미
2. Cell barcode, Feature barcode 여부
3. k-mer 적용을 통해 얻어낸 결과값에 대한 해석
4. barcode의 길이에 따른 의미 파악 (barcode의 앞, 뒤 길이, 전체 길이가 상이함)