본문 바로가기

Bioinformatics(생정보학)

GATK(Genome Analysis Toolkit) 설치

728x90
반응형

#버전 4이상의 방법

1. 아래의 사이트에 접속해 최신 GATK를 다운로드 한다.


2. /etc/bashrc에 alias gatk='/Path_to_gatk/gatk'를 설정 후 source /etc/bashrc를 실행 한다.


3. gatk실행을 위한 index파일들을 생성한다

#dictionary 파일

gatk CreateSequenceDictionary -R= Homo_sapiens.GRCh37.75.dna.primary_assembly.fa \

-O= Homo_sapiens.GRCh37.75.dna.primary_assembly.dict

#samtools fai파일

samtools faidx Homo_sapiens.GRCh37.75.dna.primary_assembly.fa


4. dbSNP나 1000genome vcf파일에 대한 indxing

 gatk IndexFeatureFile  -F cohort.vcf.gz[또는 걍 vcf파일도됨]


# 버전 2는 매우 오래된 버전임.

0. 로그인을 한다.


1. 아래의 사이트에 접속해 적절한 버전의 GATK를 다운로드한다.

https://software.broadinstitute.org/gatk/download/archive


2. 파일의 압축을 푼다.

tar xvf  GenomeAnalysisTK-2.5-2-gf57256b.tar.bz2


3. 이름을 바꿔줌, 너무 길어서

mv GenomeAnalysisTK-2.5-2-gf57256b.tar.bz2 gatk-2.5.2


4. 적절한 자바(java) 버전을 선택함

alternatives --config java (fedora의 경우)

sudo update-alternatives --config java (ubuntu의 경우)

#gatk-2.5-2는 java 1.7버전을 사용해야함.


5. 잘되는 지 확인함

java -jar GenomeAnalysisTK.jar -h



728x90
반응형

'Bioinformatics(생정보학)' 카테고리의 다른 글

gatk bundle설치  (0) 2017.03.21
Mutect 설치  (0) 2017.03.20
picard 설치하기 및 실행  (0) 2017.03.04
UCSC gtf 파일 받기  (0) 2017.03.04
TCGA data 다운로드 관련  (0) 2017.02.26