#버전 4이상의 방법
1. 아래의 사이트에 접속해 최신 GATK를 다운로드 한다.
2. /etc/bashrc에 alias gatk='/Path_to_gatk/gatk'를 설정 후 source /etc/bashrc를 실행 한다.
3. gatk실행을 위한 index파일들을 생성한다
#dictionary 파일
gatk CreateSequenceDictionary -R= Homo_sapiens.GRCh37.75.dna.primary_assembly.fa \
-O= Homo_sapiens.GRCh37.75.dna.primary_assembly.dict
#samtools fai파일
samtools faidx Homo_sapiens.GRCh37.75.dna.primary_assembly.fa
4. dbSNP나 1000genome vcf파일에 대한 indxing
gatk IndexFeatureFile -F cohort.vcf.gz[또는 걍 vcf파일도됨]
# 버전 2는 매우 오래된 버전임.
0. 로그인을 한다.
1. 아래의 사이트에 접속해 적절한 버전의 GATK를 다운로드한다.
https://software.broadinstitute.org/gatk/download/archive
2. 파일의 압축을 푼다.
tar xvf GenomeAnalysisTK-2.5-2-gf57256b.tar.bz2
3. 이름을 바꿔줌, 너무 길어서
mv GenomeAnalysisTK-2.5-2-gf57256b.tar.bz2 gatk-2.5.2
4. 적절한 자바(java) 버전을 선택함
alternatives --config java (fedora의 경우)
sudo update-alternatives --config java (ubuntu의 경우)
#gatk-2.5-2는 java 1.7버전을 사용해야함.
5. 잘되는 지 확인함
java -jar GenomeAnalysisTK.jar -h
'Bioinformatics(생정보학)' 카테고리의 다른 글
gatk bundle설치 (0) | 2017.03.21 |
---|---|
Mutect 설치 (0) | 2017.03.20 |
picard 설치하기 및 실행 (0) | 2017.03.04 |
UCSC gtf 파일 받기 (0) | 2017.03.04 |
TCGA data 다운로드 관련 (0) | 2017.02.26 |