본문 바로가기

Bioinformatics(생정보학)

CaSpER 설치법 및 사용법

728x90
반응형

CaSpER identifies and visualizes CNV events by integrative analysis of single-cell or bulk RNA-sequencing data

https://www.nature.com/articles/s41467-019-13779-x

 

CaSpER identifies and visualizes CNV events by integrative analysis of single-cell or bulk RNA-sequencing data - Nature Communic

RNA-sequencing is mostly used to assess gene expression; however, it can also give information about genetic variants. Here, the authors present CaSpER, a statistical framework that utilises RNA-sequencing reads to identify and visualise CNV events by inte

www.nature.com

 

CaSpER은 bulk- 또는 single-cell RNAseq에서 CNV event를 잡아낼 때 사용할 수 있는 프로그램임.

 

설치과정

[1] BAFExtract 설치

1. https://github.com/akdess/BAFExtract 접속

2. for hg38 라고 생긴 버튼 클릭 후 다운로드

3. unzip hg38.zip

4. git clone https://github.com/akdess/BAFExtract/

 

GitHub - akdess/BAFExtract

Contribute to akdess/BAFExtract development by creating an account on GitHub.

github.com

5.

cd BAFExtract
make clean
make

6. cd bin

7. ./BAFExtract

# 이거 실행했을 때 help option 뜨면 성공한 것임.

[2] CaSpER설치

8. R을 실행함.

9.

require(devtools)
install_github("akdess/CaSpER")

10. vim ~/.bashrc

11. alias bafextract='path/to/tool/BAFExtract'

12. source ~/.bashrc

13. 아무 디렉토리간 후에 bafextract를 치고 터미널에서 실행할 때 에러없이 help 메세지 뜨면 성공

 

[grch38 aligned RNAseq의 chromosome정보를 ucsc처럼 만들기]

cytoband정보가 필요한데 ucsc에서 다운 받아서 쓰는 것으로 되어 있어서 가장 쉽게하는 것은 저자들이 만들어둔 reference file을 활용하고 grch38로 annotation된 것들의 chromosome 부분에 chr을 붙여서 하는 것이 좋을 것으로 생각됨.

#https://www.biostars.org/p/13462/
for file in *.bam
do
  filename=`echo $file | cut -d "." -f 1`
  samtools view -H $file | \
      sed -e 's/SN:1/SN:chr1/' | sed -e 's/SN:2/SN:chr2/' | \
      sed -e 's/SN:3/SN:chr3/' | sed -e 's/SN:4/SN:chr4/' | \
      sed -e 's/SN:5/SN:chr5/' | sed -e 's/SN:6/SN:chr6/' | \
      sed -e 's/SN:7/SN:chr7/' | sed -e 's/SN:8/SN:chr8/' | \
      sed -e 's/SN:9/SN:chr9/' | sed -e 's/SN:10/SN:chr10/' | \
      sed -e 's/SN:11/SN:chr11/' | sed -e 's/SN:12/SN:chr12/' | \
      sed -e 's/SN:13/SN:chr13/' | sed -e 's/SN:14/SN:chr14/' | \
      sed -e 's/SN:15/SN:chr15/' | sed -e 's/SN:16/SN:chr16/' | \
      sed -e 's/SN:17/SN:chr17/' | sed -e 's/SN:18/SN:chr18/' | \
      sed -e 's/SN:19/SN:chr19/' | sed -e 's/SN:20/SN:chr20/' | \
      sed -e 's/SN:21/SN:chr21/' | sed -e 's/SN:22/SN:chr22/' | \
      sed -e 's/SN:X/SN:chrX/' | sed -e 's/SN:Y/SN:chrY/' | \
      sed -e 's/SN:MT/SN:chrM/' | samtools reheader - $file > ${filename}_chr.bam
done

[reference fasta file indexing, recommend하지 않음]

14. ensembl에 들어가서 GRCh38 reference fasta file을 받음 [홈페이지에서 기본적으로 제공하는 것은 hg19/38임]

아래의 파이썬 스크립트를 사용하면 자동으로 성염색체와 MT를 제외한 chromosome들을 다운 받음

01_download_ref_fa.py
0.00MB

15. gunzip *.gz하여 압축을 품

16. 아래의 파이썬으로 짠 루프를 실행해서 아래의 그림이 나오면 성공

02_BAFExtract_indexing.py
0.00MB

 

사용법

casper_tutorial.ipynb
1.00MB

728x90
반응형