본문 바로가기

R관련

Entrez, Uniprot, Ensembl id to gene symbol conversion

728x90
반응형

library(org.Hs.eg.db)

# Uniprot으로 하는 법

uni2=select(org.Hs.eg.db,'P04217',c('UNIPROT',"SYMBOL"),'UNIPROT')

또는

biocLite("UniProt.ws")

up=UniProt.ws(taxId = 9606)

columns(up)

uni2=select(up,keys=unip,columns=c("GENES","GENECARDS"))



# ENST 또는 ENSG id로 하는 법

library(ENsDb.Hspaiens.v75)

source("https://bioconductor.org/biocLite.R")

biocLite("EnsDb.Hsapiens.v75")

library(EnsDb.Hsapiens.v75)

columns(EnsDb.Hsapiens.v75)

ens2=select(EnsDb.Hsapiens.v75,keys=enst,columns=c("TXNAME","SYMBOL"),keytype="TXNAME")



# NCBI crawling으로 하는 법

tmp=readLines('https://www.ncbi.nlm.nih.gov/gene/?term=Q8N8X6',n=1000)

tm2=grep(tmp,pattern = 'Official')

tmp=tmp[seq(tm2[1],tm2[2],by=1)]

tmp=tmp[grep(tmp,pattern = 'HUGO')]

tmp=gsub(tmp,pattern = '<dd class=\"noline\">',replacement = "")

tmp=gsub(unlist(strsplit(tmp,'<'))[1],pattern = ' ',replacement = "")



728x90
반응형

'R관련' 카테고리의 다른 글

R package 만들기  (0) 2018.02.28
tidyr table다루기  (0) 2018.02.22
주식데이터 불러오기  (0) 2018.01.30
survival analysis, hazard ratio  (0) 2018.01.24
R euclidean distance(거리) 계산 빠르게 해주는 패키지  (0) 2018.01.10