본문 바로가기

Bioinformatics(생정보학)

picard 설치하기 및 실행

728x90
반응형

1. sourceforge에 들어가서 적절한 버전을 선택해 다운로드

wget https://sourceforge.net/projects/picard/files/picard-tools/1.73/picard-tools-1.73.zip


2. 압축풀기

unzip picard-tools-1.73.zip

cd picard-tools-1.73


3. java 버전 업데이트

수동으로 깔 경우 반드시 필요함. 각 피카드는 각각의 자바버전에 맞춰서 진행해야함.

1.73의 경우는  자바 1.6이어야함.

자바 1.6

sudo apt-get install oracle-java6-installer


자바 1.7

sudo apt-get install oracle-java7-installer


자바 1.8

sudo add-apt-repository ppa:webupd8team/java

sudo apt-get update

sudo apt-get install oracle-java8-set-default


자바 버전 선택

sudo update-alternatives --config java

적절한 것을 선택한 후에 enter


sudo update-alternatives --config java

sudo add-apt-repository ppa:webupd8team/java

sudo apt-get update

sudo apt-get install oracle-java8-set-default


alternatives --config java (fedora의 경우)


4. 실행하기

! 주의. 버전에 따라 picard.jar를 통해 실행하는 것도 있는데 1.73같은 경우 일일히 다른 jar파일을 실행해야함.


markduplicates : Identifies duplicate reads. Duplicates can arise during sample preparation e.g. library construction using PCR. See also EstimateLibraryComplexity for additional notes on PCR duplication artifacts. Duplicate reads can also result from a single amplification cluster, incorrectly detected as multiple clusters by the optical sensor of the sequencing instrument. These duplication artifacts are referred to as optical duplicates.

PCR이나 기타 이유로 생겨날 수 있는 중복 read를 제거하는 것임.


java -jar /mnt/tools/picard-tools-1.73/MarkDuplicates.jar VALIDATION_STRINGENCY=LENIENT I=SNU466_exo_sorted.bam O=SNU466_exo_sort_dedup.bam M=SNU466_dup.matrix



MarkDuplicates.jar

https://broadinstitute.github.io/picard/



5. 에러(error) 관련 해결하기

1. MAPQ should be 0 for unmapped read

cleanSam을 이용해도 되고 samtools에서 -q 1 을 넣어서 minimum mapping quanlity를 조절하면 됨.

728x90
반응형

'Bioinformatics(생정보학)' 카테고리의 다른 글

Mutect 설치  (0) 2017.03.20
GATK(Genome Analysis Toolkit) 설치  (0) 2017.03.20
UCSC gtf 파일 받기  (0) 2017.03.04
TCGA data 다운로드 관련  (0) 2017.02.26
ARACNE R package  (0) 2017.02.21