Bioinformatics(생정보학) 썸네일형 리스트형 MixMHCpred 실행 및 결과 불러오기 def running_mixMHCpred(x,path,mixmhcpred): ''' # parameters x : dataframe ['peptide','mhc','other columns'] # input dataframe path : /path/to/workdir # 작업경로 mixmhcpred : /path/to/mixmhcpred/MixMHCpred # 실행 파일경로 # return dataframe with mixmhcpred result # saved file /path/to/workdir/mixMHCpred_peptide_input.txt /path/to/mixMHCpred-result.txt ''' import subprocess as sbp import pandas as pd # Expo.. 더보기 dbgap controlled dataset download 1. 개요 dbgap은 NIH에서 관리하는 유전체 데이터베이스이다. 여기에는 공개된 것도 있지만 다운로드 제한이 걸린 데이터들이 있다. 여기서는 제한이 걸린 controlled dataset을 어떻게 다운받는지 말하고자 한다.여기서 전제조건은 dbgap에서 연구제안서가 승인되서 다운로드 허가가 난 경우를 가정한다. 2. 준비물당연하겠지만 sratoolkit이 있어야 한다.이 글에서는 3.0.1 버전으로 했었다.https://github.com/ncbi/sra-tools 3. 과정dbgap 로그인 후 My Research Projects에서 승인 받은 데이터셋을 찾는다.get dbGap repository key를 누른 후 file selector를 클릭한다.전체파일을 선택한 후 파일들을 다운 받는다.빨간.. 더보기 SOPRANO immunoediting dN/dS docker https://github.com/luisgls/SOPRANO GitHub - luisgls/SOPRANO: SelectiOn in PRotein ANnotated regiOns. Adapted dN/dS based method to detect selection in specific pro SelectiOn in PRotein ANnotated regiOns. Adapted dN/dS based method to detect selection in specific protein regions - GitHub - luisgls/SOPRANO: SelectiOn in PRotein ANnotated regiOns. Adapted dN/dS ... github.com # SOPRANO를 interactive.. 더보기 원하는 위치를 포함하는 K-mer 펩타이드 서열 생성하기 def generate_peptides(seq, pos, length): """ Generate peptide sequences from a given peptide sequence. Parameters: - seq: The input peptide sequence (string). - pos: The starting position for generating peptides (integer). - length: The length of the generated peptides (integer). Returns: - A list of generated peptide sequences. """ # Generate peptide sequences start=max([0,pos-length+1]) end=po.. 더보기 [python] di-peptide encoding di peptide encoding은 단백질 서열을 벡터로 표현하는 방법 중 하나로 아미노산 2개의 조합 총 400가지가 어떻게 서열 안에 구성되어 있는지를 나타낸다. import itertools from collections import Counter import numpy as np # List of standard amino acids amino_acids = "ACDEFGHIKLMNPQRSTVWY" # Generate all possible di-peptides (combinations of two amino acids) di_peptides = [''.join(pair) for pair in itertools.product(amino_acids, repeat=2)] def dipeptide_e.. 더보기 binomial distribution 신뢰구간 구하는 법 1. 개요 binomial distribution에서 신뢰구간을 구하는 방법은 2가지 종류가 있다. Normal approximation method 이 방식은 샘플의 수가 충분히 크다면 binomial distribution은 normal distribution을 따를거라고 가정한다. Wilson Score Interval method 이 방식은 샘플의 수가 작을 때 정확하다고 알려져 있다. 2. Normal approximation method 샘플의 확률/비율 (p)을 결정한다. p = x/n x = 성공한 수 n = 전체 시행 횟수 표준오차 (standard error)를 계산한다. SE = root(p*(1-p)/n) 신뢰 수준을 결정한다. 95%신뢰구간에 상응하는 Z값은 1.96 신뢰구간은 아.. 더보기 GIAB 데이터 https://www.nist.gov/programs-projects/genome-bottle Genome in a Bottle Consortium hosted by NIST dedicated to authoritative characterization of benchmark human genomes. Sign up for General GIAB and Analysis Team email lists. Public workshops held annually - next workshop will be rescheduled after COVID-19. Interested in job www.nist.gov https://www.ncbi.nlm.nih.gov/bioproject/PRJNA200694 Homo s.. 더보기 Strelka2 도커 및 실행법 도커파일 (Dockerfile) # Strelka2를 구동하기 위한 dockerfile임. FROM ubuntu:20.04 # 이상한 메세지 블락하기 ARG DEBIAN_FRONTEND=noninteractive # 필요 라이브러리 설치 시작 RUN apt-get update -qq && apt-get install -y -qq bzip2 gcc g++ make python zlib1g-dev wget RUN apt-get clean autoclean && apt-get autoremove -y WORKDIR /home RUN mkdir /home/strelka2 #RUN wget https://github.com/Illumina/strelka/releases/download/v2.9.2/strelka-.. 더보기 이전 1 2 3 4 5 ··· 12 다음