본문 바로가기

Bioinformatics(생정보학)

SOPRANO immunoediting dN/dS docker https://github.com/luisgls/SOPRANO GitHub - luisgls/SOPRANO: SelectiOn in PRotein ANnotated regiOns. Adapted dN/dS based method to detect selection in specific pro SelectiOn in PRotein ANnotated regiOns. Adapted dN/dS based method to detect selection in specific protein regions - GitHub - luisgls/SOPRANO: SelectiOn in PRotein ANnotated regiOns. Adapted dN/dS ... github.com # SOPRANO를 interactive.. 더보기
원하는 위치를 포함하는 K-mer 펩타이드 서열 생성하기 def generate_peptides(seq, pos, length): """ Generate peptide sequences from a given peptide sequence. Parameters: - seq: The input peptide sequence (string). - pos: The starting position for generating peptides (integer). - length: The length of the generated peptides (integer). Returns: - A list of generated peptide sequences. """ # Generate peptide sequences start=max([0,pos-length+1]) end=po.. 더보기
[python] di-peptide encoding di peptide encoding은 단백질 서열을 벡터로 표현하는 방법 중 하나로 아미노산 2개의 조합 총 400가지가 어떻게 서열 안에 구성되어 있는지를 나타낸다. import itertools from collections import Counter import numpy as np # List of standard amino acids amino_acids = "ACDEFGHIKLMNPQRSTVWY" # Generate all possible di-peptides (combinations of two amino acids) di_peptides = [''.join(pair) for pair in itertools.product(amino_acids, repeat=2)] def dipeptide_e.. 더보기
binomial distribution 신뢰구간 구하는 법 1. 개요 binomial distribution에서 신뢰구간을 구하는 방법은 2가지 종류가 있다. Normal approximation method 이 방식은 샘플의 수가 충분히 크다면 binomial distribution은 normal distribution을 따를거라고 가정한다. Wilson Score Interval method 이 방식은 샘플의 수가 작을 때 정확하다고 알려져 있다. 2. Normal approximation method 샘플의 확률/비율 (p)을 결정한다. p = x/n x = 성공한 수 n = 전체 시행 횟수 표준오차 (standard error)를 계산한다. SE = root(p*(1-p)/n) 신뢰 수준을 결정한다. 95%신뢰구간에 상응하는 Z값은 1.96 신뢰구간은 아.. 더보기
GIAB 데이터 https://www.nist.gov/programs-projects/genome-bottle Genome in a Bottle Consortium hosted by NIST dedicated to authoritative characterization of benchmark human genomes. Sign up for General GIAB and Analysis Team email lists. Public workshops held annually - next workshop will be rescheduled after COVID-19. Interested in job www.nist.gov https://www.ncbi.nlm.nih.gov/bioproject/PRJNA200694 Homo s.. 더보기
Strelka2 도커 및 실행법 도커파일 (Dockerfile) # Strelka2를 구동하기 위한 dockerfile임. FROM ubuntu:20.04 # 이상한 메세지 블락하기 ARG DEBIAN_FRONTEND=noninteractive # 필요 라이브러리 설치 시작 RUN apt-get update -qq && apt-get install -y -qq bzip2 gcc g++ make python zlib1g-dev wget RUN apt-get clean autoclean && apt-get autoremove -y WORKDIR /home RUN mkdir /home/strelka2 #RUN wget https://github.com/Illumina/strelka/releases/download/v2.9.2/strelka-.. 더보기
t cell 레퍼토리 종류 수 계산한 논문 https://onlinelibrary.wiley.com/doi/10.1111/imcb.12377 인간 몸 속 t세포 종류 : 5~10 x 10E+9 이론상 가능한 모든 tcell-beta chain 조합 수 : 20^29 이론상 가능한 모든 tcell-alpha chain 조합 수 : 21^31 더보기
sequence 비교 분석 (similarity vs identity) https://www.differencebetween.com/difference-between-similarity-and-identity-in-sequence-alignment/ 더보기