본문 바로가기

Bioinformatics(생정보학)

[de novo assembly] cap3 설치법 1. 개요CAP3를 설치하는 방법을 알아본다.실행환경은 리눅스이다. 그리고 conda가 깔려 있어야 한다. 2. 설치conda install bioconda::cap3설치 시에 진행 여부를 물으면 y를 누르고 엔터를 누른다. 3. 설치 확인터미널에서 cap3를 치면 관련 설명이 나온다.cap3자세한 것들은 차근차근 분석해 봐야겠다. 더보기
Samtools 설치법 1. 주의사항 여기서 서술된 것은 좀 오래된 버전을 다운 받아서 하는 것부터 진행된다. 최신 버전은 git-hub에 들어가서 다운받아서 하면 된다. 버전에 따른 데이터를 다운 받는 것이 다를 뿐 나머지 설치과정은 동일하다. 2. 다운로드를 받고 압축을 풀어준다. 여기서 보여주는 것은 오래된 samtools 버전이다. # 다운로드 wget https://sourceforge.net/projects/samtools/files/samtools/0.1.19/samtools-0.1.19.tar.bz2 # 압축풀기 tar -xf samtools-0.1.19.tar.bz2 3. make를 통해 컴파일을 해준다. # 경로 이동 및 samtools make cd samtools-0.1.19 && make 4. samto.. 더보기
pMHC1 binding benchmark running script ''' 이 스크립트는 주어진 pMHC1 조합들에 대해 아래의 툴에 대한 score를 산출하는 스크립트임. NetMHCpan 4.1 MixMHCpred2.0.2 DeepOmicsNEO MHCflurry 2.1.0 mhcnuggets ''' #파라미터 및 라이브러리 셋팅 params={ 'in':'/data01/dataset/neoantigen/public/iedb/20240308/minor-allele-testset.pickle' ,'out':'/data01/dataset/neoantigen/public/iedb/20240308/minor-allele-testset.pickle' # Softwares ,'mixmhcpred':'/data03/project/sjoh/00_tools/MixMHCpred/Mix.. 더보기
mhcnuggets 도커파일 경고 mhcnuggets는 도커 관리가 개판인 것으로 보임. 잘 안된다. 이 문제는 텐서플로우 버전과 관련된 것으로 추정되는데 저자들이 안 고치고 있다. 2024년 3월 18일 # git : https://github.com/KarchinLab/mhcnuggets/tree/master FROM python:3 COPY . mhcnuggets WORKDIR /mhcnuggets RUN python3 setup.py sdist bdist_wheel RUN pip install dist/mhcnuggets-2.4.0.tar.gz # 이부분은 에러가 생길 수 있는데 이 때는 mhcnuggets의 버전 이름을 바꿔야한다. # git에 있는 버전은 계속 업데이트 되는거 같은데 dockerfile에 적힌 버전은 관리.. 더보기
mhcflurry 설치, 실행 및 결과 불러오기 1. 설치 pip install mhcflurry mhcflurry-downloads fetch # mhcflurry 실행을 위한 파일들이 있는 경로는 아래의 명령어로 확인 가능하다. # mhcflurry-downloads path models_class1_presentation 위의 방식이 안될 때는 그냥 도커를 활용하자 아래는 도커파일이다. 이 url에서 먼저 데이터들을 다운 받는다 https://github.com/openvax/mhcflurry/ 그후 dockerfile을 수정한다. # mhcflurry dockerfile FROM continuumio/miniconda3:latest LABEL maintainer="Tim O'Donnell timodonnell@gmail.com" WORKDIR .. 더보기
MixMHCpred 실행 및 결과 불러오기 def running_mixMHCpred(x,path,mixmhcpred): ''' # parameters x : dataframe ['peptide','mhc','other columns'] # input dataframe path : /path/to/workdir # 작업경로 mixmhcpred : /path/to/mixmhcpred/MixMHCpred # 실행 파일경로 # return dataframe with mixmhcpred result # saved file /path/to/workdir/mixMHCpred_peptide_input.txt /path/to/mixMHCpred-result.txt ''' import subprocess as sbp import pandas as pd # Expo.. 더보기
dbgap controlled dataset download 1. 개요 dbgap은 NIH에서 관리하는 유전체 데이터베이스이다. 여기에는 공개된 것도 있지만 다운로드 제한이 걸린 데이터들이 있다. 여기서는 제한이 걸린 controlled dataset을 어떻게 다운받는지 말하고자 한다. 여기서 전제조건은 dbgap에서 연구제안서가 승인되서 다운로드 허가가 난 경우를 가정한다. 2. 준비물 당연하겠지만 sratoolkit이 있어야 한다. 이 글에서는 3.0.1 버전으로 했었다. https://github.com/ncbi/sra-tools 3. 과정 dbgap 로그인 후 My Research Projects에서 승인 받은 데이터셋을 찾는다. get dbGap repository key를 누른 후 file selector를 클릭한다. 전체파일을 선택한 후 파일들을 다운.. 더보기
SOPRANO immunoediting dN/dS docker https://github.com/luisgls/SOPRANO GitHub - luisgls/SOPRANO: SelectiOn in PRotein ANnotated regiOns. Adapted dN/dS based method to detect selection in specific pro SelectiOn in PRotein ANnotated regiOns. Adapted dN/dS based method to detect selection in specific protein regions - GitHub - luisgls/SOPRANO: SelectiOn in PRotein ANnotated regiOns. Adapted dN/dS ... github.com # SOPRANO를 interactive.. 더보기