본문 바로가기

파이썬3

딕셔너리 (dictionary) 딕셔너리는 key와 value로 구성되어 있다. R의 리스트와 비슷하다. 예를들어 지금 사용하는 컴퓨터의 구성 요소를 설명한다고 보자. 컴퓨터에는 CPU, GPU, RAM, 메인보드 등의 다양한 모델 정보가 있을 것이다. 리스트나 튜플은 단순한 나열만 가능할 것이지만 딕셔너리는 {key1:value1, key2:value2, ....}로 구성된다. # 모델명들 cpu = 'a1234' gpu = 'b1234' ram = '16gb' board = 'msi1234' # 리스트 [cpu, gpu, ram, board] # ['a1234','b1234','16gb','msi1234'] # 튜플 cpu, gpu, ram, board # ('a1234','b1234','16gb','msi1234') # 딕셔너리 .. 더보기
튜플 (tuple) 튜플은 리스트와 거의 비슷하지만 2가지 차이가 있다. 리스트는 [ ]으로 감싸지만 튜플은 ( )으로 한다. 리스트는 값을 수정할 수 있지만 튜플은 할 수 없다. a = () b = (1,) c = (1,2,3) d = 1,2,3,4 #리스트와 달리 괄호가 필요하지 않다. e = ('a','b',('abc','def')) 튜플은 리스트와 사용법이 거의 비슷하다 # 인덱싱 a = (1,2,'a','b','c') a[0] # 1 # 슬라이싱 a[:3] # (1,2,'a') # 덧셈 b = (3,4) a + b # (1,2,'a','b','c',3,4) # 곱셉 b * 3 (3,4,3,4,3,4) # 원소 위치 찾기 c = 'a','b','c','d','a' c.index('a') # 0 더보기
리스트 (list) 수정하기 리스트 값을 수정할 때는 인덱싱을 하거나 del/append를 이용해 삭제/추가할 수 있다. 또한 sort와 reverse로 정렬할 수 있다. # 인덱싱 a = [1,2,3] a[1]=4 a #[1,4,3] # del함수 a = [1,2,3] del a[2] a # [1,2] a = [1,2,3,4,5] del a[1:] a # [1] a = [1,2,3,4] a.append(5) a # [1,2,3,4,5] # 정렬 a = [1,10,9,7] a.sort() a # [1,7,9,10] # 반대로 정렬 a.reverse() a #[10,9,7,1] 또한 insert기능으로 지정된 위치에 새로운 원소를 삽입할 수도 있다. 그리고 remove를 통해 지정된 값에 해당하는 원소를 삭제할 수 있다. 단 remo.. 더보기
리스트 (list) 자료형 파이썬은 리스트 자료형이 있으며 이것은 R의 벡터와 리스트와 비슷한 성격을 띤다. 리스트는 어떤 자료들을 묶어서 사용할 때 용이하다. # 다양한 형태의 리스트 a = [] # 빈 리스트. b = list() #a와 동일하다 c = ['life','is','too','boring'] d = [1,2,'life','is'] e = [1,2,['life','is']] 파이썬은 인덱싱과 슬라이싱을 활용해 리스트 내의 원소를 추출/사용할 수 있다. 여기서 파이썬은 인덱스를 0부터 시작한다. a = [1,2,3,4] a[0] #1 a[0]+a[3] #1+4=5 만일 마지막 원소를 뽑고 싶을 때는 -1부터 시작하면 된다. -0은 0이라서 이렇게 한거로 보인다. a=[1,2,3,4] a[-1] # 4 리스트의 슬라이싱.. 더보기
파이썬 문자열 (string) 문자열은 문자, 단어 등으로 구성된 문자들을 말한다. 'Life is too short, You need python' "Life is too short, You need python" "123456" 위의 예시와 같이 큰 따옴표나 작은 따옴표로 감싸면 문자열로 만들 수 있다. 이외에도 주석용으로 자주 사용하는 '''나 """도 있다. '''Life is long, you need python''' """Life is long, Youn need python""" 자주 사용하지 않지만 같은 따옴표 내에 동일한 따옴표를 넣고 싶을 수도 있는데 예를들면 He's running을 작은 따옴표로 감쌀 때는 백슬래시 (\)를 사용해야한다. 'He's running' # SyntaxError: invalid syn.. 더보기
파이썬 사칙연산 데이터 분석에 자주 사용되는 R과 파이썬은 동일한 사칙연산을 기호들을 공유한다. 몇 가지 다른 경우들은 불렛 포인트로 달아 놓았다. 1. 덧셈 (+) # 파이썬 덧셈 a = 1 b = 4 a + b # 5 2. 뺄셈 (-) # 파이썬 뺄셈 a = 1 b = 5 a - b # -4 3. 나눗셈 (/) 몫을 구할 때는 //를 쓰면 된다. 나머지를 구할 때는 %를 쓰면된다. # 나눗셈 a = 10 b = 2 a/b # 5 # 몫 구하기 a//b # 5 # 나머지 구하기 a % b # 0​ 4. 곱셈 (*) x의 y승을 나타낼 때는 **를 쓴다. # 단순 곱셈 a = 3 b = 4 a * b # 12 # x의 y승 (**) a ** b # 3 x 3 x 3 x 3 # 81 더보기
파이썬 (python) 설치 파이썬을 설치하는 방법은 아래와 같다. 1. 구글에 '파이썬'을 검색하고 각자의 운영체제에 맞는 패키지를 다운 받는다. https://www.python.org/downloads/windows/ 리눅스나 맥은 기본적으로 설치 되어있다. 글을 쓰는 시점에서 버전 2.x는 지원이 종료될 예정이니 버전 3.x를 다운받아 설치하자. 윈도우의 경우 빨간색 박스가 쳐진 Windows installer를 다운받으면 된다. 2. 다운받은 설치파일을 실행한다. 크롬이나 엣지의 설정을 건들지 않았다면 '다운로드' 폴더에 저장되어 있을 것이다. Add Python 3.x to PATH를 하게되면 터미널을 실행 시에 복잡하게 경로를 잡아줄 필요 없이 파이썬을 실행할 수 있게 해준다. 3. 설치가 완료되면 close를 눌러 종.. 더보기
유전자의 펩타이드 시퀀스 불러오는 함수 biopython을 잘 사용할 줄 알면 쉽게 할 수 있을지 모르겠으나 구글링을 해도 누군가 만들어 둔 것이 없고 튜토리얼은 nucleotide서열을 불러오는 것만 있어서 다른 라이브러리를 활용해 만듬. import requests as r from Bio import SeqIO from io import StringIO import mygene as mg import pandas as pd mg = mg.MyGeneInfo() def gene2peptide(gene,taxid=9606): ''' This function will return every uniprotID and peptide sequence for the given gene. :param gene : gene ids :param taxid.. 더보기