1. sourceforge에 들어가서 적절한 버전을 선택해 다운로드
wget https://sourceforge.net/projects/picard/files/picard-tools/1.73/picard-tools-1.73.zip
2. 압축풀기
unzip picard-tools-1.73.zip
cd picard-tools-1.73
3. java 버전 업데이트
수동으로 깔 경우 반드시 필요함. 각 피카드는 각각의 자바버전에 맞춰서 진행해야함.
1.73의 경우는 자바 1.6이어야함.
자바 1.6
sudo apt-get install oracle-java6-installer
자바 1.7
sudo apt-get install oracle-java7-installer
자바 1.8
sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update
sudo apt-get install oracle-java8-set-default
자바 버전 선택
sudo update-alternatives --config java
적절한 것을 선택한 후에 enter
sudo update-alternatives --config java
sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update
sudo apt-get install oracle-java8-set-default
alternatives --config java (fedora의 경우)
4. 실행하기
! 주의. 버전에 따라 picard.jar를 통해 실행하는 것도 있는데 1.73같은 경우 일일히 다른 jar파일을 실행해야함.
markduplicates : Identifies duplicate reads. Duplicates can arise during sample preparation e.g. library construction using PCR. See also EstimateLibraryComplexity for additional notes on PCR duplication artifacts. Duplicate reads can also result from a single amplification cluster, incorrectly detected as multiple clusters by the optical sensor of the sequencing instrument. These duplication artifacts are referred to as optical duplicates.
PCR이나 기타 이유로 생겨날 수 있는 중복 read를 제거하는 것임.
java -jar /mnt/tools/picard-tools-1.73/MarkDuplicates.jar VALIDATION_STRINGENCY=LENIENT I=SNU466_exo_sorted.bam O=SNU466_exo_sort_dedup.bam M=SNU466_dup.matrix
MarkDuplicates.jar
https://broadinstitute.github.io/picard/
5. 에러(error) 관련 해결하기
1. MAPQ should be 0 for unmapped read
cleanSam을 이용해도 되고 samtools에서 -q 1 을 넣어서 minimum mapping quanlity를 조절하면 됨.
'Bioinformatics(생정보학)' 카테고리의 다른 글
Mutect 설치 (0) | 2017.03.20 |
---|---|
GATK(Genome Analysis Toolkit) 설치 (0) | 2017.03.20 |
UCSC gtf 파일 받기 (0) | 2017.03.04 |
TCGA data 다운로드 관련 (0) | 2017.02.26 |
ARACNE R package (0) | 2017.02.21 |