본문 바로가기

파이썬3

conda 환경 파일인 yaml 관련 문서 현재 설치된 conda환경의 라이브러리를 정리하는 명령어는 아래와 같다. conda env export > environment.yaml yaml파일로부터 conda환경을 다시 만들고 싶으면 아래의 명령어를 쓰면 된다. conda env create --file environment.yaml --name 하고싶은이름 ''' --name 옵션 안주면 conda environment가 생성이 안되는 것 같다. 문제는 yaml파일의 출처에 해당하는 컴퓨터에선 어떻게 설치했는지 모르겠지만 충돌이 일어나는 라이브러리로 범벅이 되있으면 새로운 환경에서 설치가 안되는 것 같다. 그냥 docker를 요구하는게 현명할 수 있다. ''' yaml파일로부터 기존의 환경을 업데이트 하고 싶으면 아래의 방식을 쓰면 된다. # .. 더보기
유전자 정보 불러오기 (mygene) In [1]: import mygene In [2]: mg = mygene.MyGeneInfo() In [3]: mg.getgene(1017) Out[3]: {'_id': '1017', 'entrezgene': 1017, 'name': 'cyclin-dependent kinase 2', 'symbol': 'CDK2', 'taxid': 9606, ... } # use "fields" parameter to return a subset of fields In [4]: mg.getgene(1017, fields='name,symbol,refseq') Out[4]: {'_id': '1017', 'name': 'cyclin-dependent kinase 2', 'refseq': {'genomic': ['AC_00.. 더보기
주피터 노트북 (jupyter-notebook) 서버 리스트 확인하기 jupyter-notebook list 더보기
KS-test D-statistics 위치 파악하는 스크립트 def where_is_d(x,y): ''' param x,y: 숫자들로 이루어진 list (ex. [1,2,3]) return w[o[i]]: 해당값은 ecdf-plot에서 x축의 위치를 의미하게됨. 오류가 발생한다면 다양한 지점이 D값을 가질 수 있어서임. ''' n,m=len(x),len(y) w=x+y o=np.argsort(w) o1=[m if o_i 더보기
pandas apply axis 방향 pandas를 다루면 axis의 방향은 늘 헷갈린다. pandas 홈페이지의 apply에대한 설명을보면 axis에 대해 아래와 같이 되어 있다. 즉 위의 내용에 따르면, axis를 0 (index)으로 하면 column별로 연산이 적용되고 axis를 1 (column)으로 하면 row별로 연산이 적용되게 만들었다. 아래의 그림은 pandas의 axis별 연산이 어떻게 들어가는지에 대한 표이다. axis=0일 때는 R에서 colSum, colMean과 같이 column-wise 연산이 들어가는 것이고 axis=1일 때는 R에서 rowSum, rowMean과 같이 row-wise 연산이 들어가는 것이다. 더보기
판다스 텍스트로 행 (row) 늘리기 df["기존열"]=df["기존열"].str.split("나누려는_문자") 더보기
파이썬 while문 반복해서 어떤 함수를 실행 할 때 사용하는 것 중 하나는 while문이다. 그래서 while반복문이라고도 불린다. 아래는 while문의 기본 구조이다. while 조건문: do-something1() do-something2() do-something3() .... # 생략표현 do-somethingN() GPU를 사기 위해 돈을 번다고 할 때 시급 1만원에 따라 벌어야하는 과정을 while문으로 표현하면 아래와 같다. money = 0 gpu_price = 9.5 * 1e+5 # 95만원 hour_pay = 1e+4 # 1만원 working_hour = 0 # 일한 시간 while money < gpu_price: working_hour += 1 money += hour_pay print(working.. 더보기
파이썬 생존분석과 Kaplan-meier plot 그리기 # Survival analysisfrom sksurv.nonparametric import kaplan_meier_estimatorfrom lifelines.statistics import *import matplotlib.pyplot as pltdef surv_analysis(x=None,xlab='Day',ylab='Survival probability'): ''' This function draws KM-plot and return p-value. x:dataframe that must contain 'os','vital_status',and 'subtype' ''' if x is None: print('provide dataframe') pri.. 더보기