728x90
반응형
import pandas as pd
def vcf2df(path):
'''
이 명령어는 vcf파일을 pd.DataFrame으로 변환하기 위한 스크립트임.
path : 파일 경로
'''
with open(path,'r') as f:
lines = f.readlines()
chrom_index = [i for i, line in enumerate(lines) if line.strip().startswith("#CHROM")]
data = lines[chrom_index[0]:]
header = data[0].strip().replace('#','').split("\t")
informations = [d.strip().split("\t") for d in data[1:]]
vcf = pd.DataFrame(informations, columns=header)
return vcf
728x90
반응형
'파이썬3' 카테고리의 다른 글
symbol to phred score 변환 파이썬 기능 (0) | 2023.08.31 |
---|---|
2개의 회귀선의 기울기를 통계적으로 비교하는 법 (0) | 2023.08.22 |
protein sequence one-hot encoding (0) | 2023.02.02 |
tensorflow==1.13.1설치 도커 (0) | 2022.04.27 |
유전자 정보 불러오기 (mygene) (0) | 2022.04.13 |