인체에는 일련의 방어선이 있고, 그 방어 체계에는 물리적 장벽, 백혈구, 항체 및 보체 단백질과 같은 분자 등이 있다.
- 물리적 장벽: 피부, 눈의 각막, 호흡관, 소화관, 배뇨관, 생식관을 둘러싼 점막
- 백혈구: 혈류를 따라 흘러 조직에 들어가 미생물과 다른 침입자들을 찾아서 공격한다.
선천 면역과 후천 면역
- 선천 면역: 예전에 미생물이나 다른 침입자를 접하지 않았어도 기능을 발휘한다.
-후천 면역: 림프구라고 불리는 백혈구(B 세포 및 T 세포)가 침입자를 만나서 공격 방법을 학습하고, 특정 공격자를 기억하여 다음에 만날 때 보다 효과적으로 공격할 수 있게 된다. 후천 면역은 새 침입자를 처음에 만난 후에 시간이 흘러야 생기는데 그 이유는 림프구가 이에 적응해야 하기 때문이다. 그러나 그 후에는 신속히 반응한다. B 세포와 T 세포가 협력하여 공격자를 파괴한다. 침입자를 인식하기 위해 T 세포는 항원 제시 세포라고 하는 세포(예: 수지상 세포— T 세포가 항원을 인식하는 방법)로부터 도움을 받는다. 이들 세포가 침입자를 삼키고 조각으로 분해한다.
B/T 세포와 BCR/TCR
1. T 세포와 TCR
T 세포(T 림프구)는 후천 면역에 관여하는 백혈구로, T 세포에는 도움, 살해(세포독성), 조절의 세 가지 유형이 있다.
- 도움 T 세포: B 세포가 외부 항원에 대한 항체를 생산하도록 지원하고 살해 T 세포가 활성화되는 것을 돕고, 대식세포를 자극하여 감염 세포 또는 이상 세포를 보다 효율적으로 삼킬 수 있게 해주는 백혈구
- 살해(세포독성) T 세포: 감염 세포 및 암세포에 부착하여 이를 죽이는 T 세포
- 조절(억제) T 세포: 면역 반응 종료를 돕는 백혈구
- T 세포는 크게 CD4 T세포와 CD8 T세포로 나뉘어진다. 이중, CD4 T세포가 활성화되면, 분화되어 주로 면역반응을 유도하거나 다른 면역세포의 기능을 도와주는 역할을 하여 helper T세포로 된다. CD8 T세포는 활성화되면 주로 감염된 세포나 비정상적인 항원을 발현하는 세포를 공격하여 죽이는 cytotoxic T세포로 변화가 된다. 이와 같은 T세포 반응에서, 가장 중요한 반응중의 하나가 T세포 수용체(T cell receptor)에 의한 외부항원의 인식이며, 이와 같은인식을 통해 세포 내에 T세포가 활성화될 수 있도록 다양한 신호전달체계가 활성화된다.
2. B세포와 BCR
- B 세포(B 림프구)는 항체 생산을 자극했던 항원에 해당되는 항체를 생산하는 백혈구이다.
- B 세포 또한 B 세포 수용체(B cell receptor)를 가지고 있으며, 이 수용체를 통하여 외부 항원을 인식한다. 마찬가지로, B 세포 수용체가 외부 항원을 인식하면, 세포 내에 B 세포가 활성화 될 수 있도록 다양한 신호전달체계가 활성화 된다. 즉, 항원수용체(antigenreceptor)에 의한 외부 항원의 인식 및 이를 통한 세포 내 신호전달체계의 활성화는 후천성 면역반응을 시작함에 있어 매우 중요한 단계이다.
- T 세포 및 B세포가 항원수용체를 인식하여 활성화 될 때, T 세포 또는 B 세포의 분화 및 기능에 다양한 요소들이 역할을 하는데, 이중 보조수용체(costimulator)가 중요한 역할을 한다. 예를 들면, T 세포에서는 CD28이라는보조수용체가, B 세포에서는 CD40라고 하는 보조수용체가 중요한역할을 한다.
scRNA-seq Analysis Pipeline
1. Preprocessing
1) Quality Control: low-quality cell의 영향을 배제하기 위함
- FastQC를 사용하여 quality distributions across entire reads를 확인한다.
- (보통은 3' 끝에 위치한) Low-quality bases나 adapter sequences를 제거한다.
2) Read Alignment
- DNA 시퀀싱 데이터에서 읽은 단일 리드(read)를 참조 유전체(reference genome)의 위치에 매핑하는 과정
- read는 원본 DNA 시퀀스의 일부를 나타내며, 시퀀싱 과정 중에는 read의 역전 및 수정도 발생할 수 있어서, read alignment를 통해 시퀀싱 리드를 유전체의 특정 위치에 정확하게 할당하여 다양한 생물학적 의미를 추론한다.
- BWA나 STAR를 이용하여 리드를 유전체에 정렬한다.
- UMIs가 사용되는 경우에는 정렬 전에 이 시퀀스들을 제거한다.
3) Post-alignment Statistics:
- RNA-seQC프로그램을 활용하여 정렬된 데이터에 대한 요약 통계를 생성한다.
-고유하게 매핑된 리드의 수, 주석이 달린 exonic region에 매핑된 리드의 수 등을 확인할 수 있다.
4) Quality Check with External Spike-ins:
-외부 스파이크인을 추가하여 RNA의 품질을 확인한다.
- 알려진 수량과 염기서열을 가진 외부 스파이크인을 사용하여 RNA 품질을 교정하고 검사한다.
2. Normalization
- scRNA-seq 데이터에서는 dropout 또는 일시적인 유전자 발현과 같은 이유로 zero-inflated counts가 나타나므로,normalization은 downstream 응용 프로그램(예: differential gene expression 결정)에 영향을 미칠 수 있는 세포별bias를 제거하는 데 필요하다.
- 일반적으로각 세포에서 각 유전자의 리드 카운트는 유전자별 발현 수준과 세포별 스케일링 요인에 비례한다. 이러한 부수적 변수들은 보통은 추정하기 어려우며, 고정된 요소로 모델링된다.
- 가장 일반적으로 사용되는 normalization 방법에는 RPKM, FPKM 및 TPM이 있고, 대부분의 유전자가 차이가 없다고 가정하고 세포 간에 표준화를 수행한다.
3. DR - Confounding Factors 추정
- 실험 조건에 따라 캡처되고시퀀싱된 세포만이 존재하기 때문에 batch effect가 뚜렷하게 나타난다.
- 동일한 조건에서 여러 세포를 반복 분석하여 배치 효과에 의한 technical variability를 평가하는 것이 도움이 될 수 있다.
- 기술적 잡음 외에도 생물학적 변수가 gene expression profiles에 영향을 미칠 수 있다.
- 최근에는 scLVM과 같은 방법이 개발되어 latent variables에 의해 설명되는 변동을 제거하는 데 사용된다.
4. Clustering
- 미토콘드리아 유전자가 풍부한 클러스터를 식별하여 low-quality cells을 발견하는 데 사용되는 유용한 방법
- 클러스터링 후에는 서로 다른 클러스터 간에 다르게 발현되는 마커 유전자를 식별하고, 이를 위해 poisson 분포 대신 negative binomial 모델이 사용된다. (단일 세포 데이터의 여러 noise를 고려하기 위해 적합해서)
- 이러한 모델은 증폭되지 않거나 감지되지 않는 전사체와 증폭되고 풍부한 전사체를 구별하기 위해 사용된다.
5. Differential Gene Expression
- 여러 조건 또는 시점 간의 그룹 간 차이를 분석하여 특정 유전자가 어떤 조건 또는 상황에서 발현되는지를 식별한다.
- top‐performing DE analysis tools: DESeq2,EdgeR in combination with weights estimated by ZINB‐wave
6. Gene ExpressionDynamics
- 시간이나 다른 변화 요인에 따른 유전자 발현의 변화를 분석한다.
- Monocle, Slingshot, SCENIC, Velocyto 등의 tool을 사용한다.
a: batch effect 발생; cell-specific scaling factors, such as capture and RT efficiency, dropout/amplification bias, dilution factor, and sequencing amount 때문 b: PCA를 사용한 scLVM은 세포주기 효과에 의해 설명되는 변동성을 효과적으로 제거한다. c: gene expression 값 y는 기술적 및 생물학적 요인, 그리고 잠재 요인과 잡음 행렬의 linear combination으로 모델링될 수 있다.