본문 바로가기

Bioinformatics(생정보학)

CMap (Connectivity map) The Connectivity Map: using gene-expression signatures to connect small molecules, genes, and disease. 이중 repurposing-app에서는 drug target과 clinical phage 등을 확인할 수 있음https://clue.io/repurposing-app 더보기
Consensus clustering 샘플들을 frequency로 묶인정도를 파악한 후에 cluster의 robustness를 파악하는 방법임CDF의 유의미한 차이가 있는 것까지를 선택함. 2014년 scientific report에 따르면위의 방식이 최적의 k를 보장하지 않을 수 있다는 결과가 발표되었고이에 따라 PAC(Proportion of ambiguously clustered)로 파악하는 것이 좋다는 논문이 나옴Critical limitations of consensus clustering in class discovery, Scientific reportshttps://www.nature.com/articles/srep06207 PAC 계산 관련 R code https://www.biostars.org/p/198789/ #####.. 더보기
Principal component analysis (PCA, 주성분 분석) http://tongtongsear.tistory.com http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf 더보기
integrative modeling of multi-omics data to identify cancer drivers and infer patient-specific gene activity integrative modeling of multi-omics data to identify cancer drivers and infer patient-specific gene activity 더보기
TMM normalization y=DGEList(counts=matrix)y=calcNormFactors(y)tmm_mat=cpm(y,normalized.lib.sizes=TRUE) https://support.bioconductor.org/p/77193/ I don't think it's clear what you are asking for. Let's assume that y is your DGEList with your count data, which you already called calcNormFactors on. Are you after the TMM normalization factors? These are stored in your y$samples$norm.factors column. Do you just want .. 더보기
htseq-count http://www-huber.embl.de/HTSeq/doc/count.html RNAseq의 mapping read count 구하는 것 htseq-count -s no -a 0 -t gene -i gene_name -f bam hbec30.rnaseq.r1.fastq.bam ../example/reference/gencode.v19.annotation.gtf > hbec30.r1.count -t : gtf 파일의 3번 째 column의 feature 중 무엇을 쓸 것인지 (defalut exon)-s : stranded data인지-f : input format-a : mapping quality filter (skip all reads with alignment quality lower than .. 더보기
GENCODE https://www.gencodegenes.org/releases/19.html# GTFGFF 더보기
tophat2 설치 Tophat2는 RNAseq의 정보를 정량하기 위해 사용되는 프로그램입니다. 최신, tophat2를 다운받을 수 있는 곳은 아래와 같습니다.https://ccb.jhu.edu/software/tophat/index.shtml 또한 boost library가 필요합니다. 아래의 사이트에 들어가셔서 합니다. (1.47 이상으로 필요합니다.) http://www.boost.org/users/download/ 그리고 bowtie2가 필요합니다. 이외에 reference genome에 대한 indexing과정도 필요합니다. http://bowtie-bio.sourceforge.net/bowtie2/index.shtml 설치는 다음과 같이 진행합니다.1. boost를 다운로드 받는다.2. ./bootstrap.sh.. 더보기