CaSpER identifies and visualizes CNV events by integrative analysis of single-cell or bulk RNA-sequencing data
https://www.nature.com/articles/s41467-019-13779-x
CaSpER은 bulk- 또는 single-cell RNAseq에서 CNV event를 잡아낼 때 사용할 수 있는 프로그램임.
설치과정
[1] BAFExtract 설치
1. https://github.com/akdess/BAFExtract 접속
2. for hg38 라고 생긴 버튼 클릭 후 다운로드
3. unzip hg38.zip
4. git clone https://github.com/akdess/BAFExtract/
5.
cd BAFExtract
make clean
make
6. cd bin
7. ./BAFExtract
# 이거 실행했을 때 help option 뜨면 성공한 것임.
[2] CaSpER설치
8. R을 실행함.
9.
require(devtools)
install_github("akdess/CaSpER")
10. vim ~/.bashrc
11. alias bafextract='path/to/tool/BAFExtract'
12. source ~/.bashrc
13. 아무 디렉토리간 후에 bafextract를 치고 터미널에서 실행할 때 에러없이 help 메세지 뜨면 성공
[grch38 aligned RNAseq의 chromosome정보를 ucsc처럼 만들기]
cytoband정보가 필요한데 ucsc에서 다운 받아서 쓰는 것으로 되어 있어서 가장 쉽게하는 것은 저자들이 만들어둔 reference file을 활용하고 grch38로 annotation된 것들의 chromosome 부분에 chr을 붙여서 하는 것이 좋을 것으로 생각됨.
#https://www.biostars.org/p/13462/
for file in *.bam
do
filename=`echo $file | cut -d "." -f 1`
samtools view -H $file | \
sed -e 's/SN:1/SN:chr1/' | sed -e 's/SN:2/SN:chr2/' | \
sed -e 's/SN:3/SN:chr3/' | sed -e 's/SN:4/SN:chr4/' | \
sed -e 's/SN:5/SN:chr5/' | sed -e 's/SN:6/SN:chr6/' | \
sed -e 's/SN:7/SN:chr7/' | sed -e 's/SN:8/SN:chr8/' | \
sed -e 's/SN:9/SN:chr9/' | sed -e 's/SN:10/SN:chr10/' | \
sed -e 's/SN:11/SN:chr11/' | sed -e 's/SN:12/SN:chr12/' | \
sed -e 's/SN:13/SN:chr13/' | sed -e 's/SN:14/SN:chr14/' | \
sed -e 's/SN:15/SN:chr15/' | sed -e 's/SN:16/SN:chr16/' | \
sed -e 's/SN:17/SN:chr17/' | sed -e 's/SN:18/SN:chr18/' | \
sed -e 's/SN:19/SN:chr19/' | sed -e 's/SN:20/SN:chr20/' | \
sed -e 's/SN:21/SN:chr21/' | sed -e 's/SN:22/SN:chr22/' | \
sed -e 's/SN:X/SN:chrX/' | sed -e 's/SN:Y/SN:chrY/' | \
sed -e 's/SN:MT/SN:chrM/' | samtools reheader - $file > ${filename}_chr.bam
done
[reference fasta file indexing, recommend하지 않음]
14. ensembl에 들어가서 GRCh38 reference fasta file을 받음 [홈페이지에서 기본적으로 제공하는 것은 hg19/38임]
아래의 파이썬 스크립트를 사용하면 자동으로 성염색체와 MT를 제외한 chromosome들을 다운 받음
15. gunzip *.gz하여 압축을 품
16. 아래의 파이썬으로 짠 루프를 실행해서 아래의 그림이 나오면 성공
끝
사용법
'Bioinformatics(생정보학)' 카테고리의 다른 글
HLA nomenclature (명명법) (0) | 2022.09.05 |
---|---|
생물정보학 혼자 시작할 때 좋은 무료 자료 (0) | 2022.07.09 |
single-cell RNAseq annotation benchmark (0) | 2021.12.09 |
Pharos: Target list DB (0) | 2021.11.19 |
WES alignment pipeline (0) | 2019.04.11 |