본문 바로가기

DeepLearning

[PRML] 1.2 Probability theory (확률 이론) 1. 개요 패턴 인식의 분야에서 중요한 개념 중 하나는 불확실성 (uncertainty)이다. 이것은 노이즈나 유한한 데이터 크기 등 다양한 원인으로 생길 수 있다. 확률 이론은 불확실성에 대한 측정 (quantification)과 조절 (manipulation)을 위한 일관된 뼈대를 제공한다. 비록 불완전하거나 애매할 수 있지만, 이것이 결정이론 (decision theory, 챕터 1.5)와 결합되면 활용가능한 모든 주어진 정보에 대해 적절한 예측을 가능하게 해준다. 2. 내용 예시로 빨강 상자에는 사과 2개와 오렌지 6개가 있고 파랑 상자에는 사과 3개와 오렌지 1개가 있다. 여기서 무작위로 박스를 선택한 후, 무작위로 과일을 고른 후 다시 해당 상자에 돌려 넣는 과정을 수 많이 반복해보자. 이랬을.. 더보기
[PRML] 1.1 Example: Polynomial Curve Fitting 1. 목적 간단한 회귀 문제 (regression problem)을 통해 몇 가지 중요한 개념들을 이해하도록 한다. 2. 내용 sin(2πx) 함수에 랜덤 노이즈를 추가하여 예시 데이터를 생성함. x와 위의 함수에 집어넣을 때 나오는 값은 t로 하고 길이는 N의 행렬을 만듬. 이 때 x는 0부터 1까지 uniform distribution으로 생성함. 목표하는 바는 훈련데이터셋으로 새로운 입력값 x_het에 대해 t_het을 예측하는 것임. 이를 위해 다항함수 (polynomial function)을 적용함. 이러한 형태의 모델을 선형 모델 (linear model)이라함. w의 계수값은 오차 함수 (error function)의 값을 최소화 시키는 방법으로 결정될 수 있다. 오차 함수란 예측값과 실제값.. 더보기
[PRML] 1. introduction 0. 왜 중요한가? 데이터 내의 패턴을 찾는 것은 가장 근본적인 것이며 긴 역사를 갖는다. 예를들어 케플러가 행성관측을 통해 고전역학 발전의 출발점이 된 사례가 있다. 1. 용어들 Training set : 모델의 매개변수 (parameters)를 조정 (tune)하기 위해 사용되는 데이터 셋 Target vector : 입력된 변수에 상응하는 정답 Training phase : learning phase라고도 하며 모델 (f(y))가 조정되어 가는 단계. Test set : 학습이 종료된 후에 훈련이 잘됐는지 평가하기 위해 사용되는 데이터 셋 Generalization : 학습 때 보지 않은 예제들에 대해 올바르게 분류하는 능력. 훈련데이터는 입력 가능한 경우 중 지극히 일부이므로 패턴 인식에서 gen.. 더보기
파이토치 시드 (seed)값 고정법 import torch import numpy as np import random import os def seed_everything(seed=42): random.seed(seed) np.random.seed(seed) torch.manual_seed(seed) torch.cuda.manual_seed_all(seed) torch.backends.cudnn.benchmark = False torch.use_deterministic_algorithms(True) os.environ["PYTHONHASHSEED"] = str(seed) os.environ["TF_ENABLE_ONEDNN_OPTS"] = "0" 파이토치 시드 넘버를 고정해야 재현성 있는 결과가 나옴. 다만, 시드를 고정하면 훈련속도가 떨어.. 더보기
The Unsupervised Reinforcement Learning Benchmark 지도 강화학습의 단점들 (The shortcomings of supervised RL) 강화 학습(Reinforcement Learning, RL)은 자율 차량 제어, 디지털 비서 (digital assistants), 리소스 할당과 같은 AI의 많은 문제를 해결하기 위한 알고리즘 외부 보상 기능 (extrinsic reward function)이 제공될 때, RL 에이전트가 바둑이나 스타크래프트 같은 매우 복잡한 작업을 수행가능 하지만, 이런 놀라운 결과에도 사용 범위가 매우 좁음. 오늘날 대부분의 RL 알고리즘은 훈련된 단일 작업만 해결할 수 있으며 크로스 작업 (cross-task) 또는 크로스 도메인 (cross-domain) 일반화 기능이 없음. (Even the best RL agents to.. 더보기