[머신러닝 교과서] Ch02 객체지향 퍼셉트론 API 분석

Artificial Intelligence/Studying

[머신러닝 교과서] Ch02 객체지향 퍼셉트론 API 분석

geum 2020. 9. 20. 16:38

'''
퍼셉트론 인터페이스 가진 파이썬 클래스 정의

1. Perceptron 객체 초기화 후 fit 메서드로 데이터에서 학습
2. 별도의 predict 메서드로 예측 생성

cf. 객체 초기화 과정에서 생성하지 않고 다른 메서드 호출하여 만든 속성은 _ 추가
'''

import numpy as np

class Perceptron(object):
    '''퍼셉트론 분류기

    --------------
    매개변수
    --------------
    eta : float
    -> 학습률(0.0과 1.0 사이)

    n_iter : int
    -> 훈련 데이터셋 반복 횟수

    random_state : int
    -> 가중치 무작위 초기화를 위한 난수 생성기 시드


    --------------
    속성
    --------------
    w_ : 1d-array
    -> 학습된 가중치

    errors_ : list
    -> 에포크마다 누적된 분류 오류

    '''

    def __init__(self, eta=0.01, n_iter=50, random_state=1):
        self.eta = eta
        self.n_iter = n_iter
        self.random_state = random_state

    def fit(self, X, y):
        '''훈련 데이터 학습

        --------------
        매개변수
        --------------
        X : {array-like}, shape = [n_samples, n_features]
        -> n_samples개의 샘플과 n_features개의 특성으로 이루어진 훈련 데이터

        Y : array-like, shape = [n_samples]
        -> 타겟 값


        --------------
        반환값
        --------------
        self : object
        '''

        # numpy random number genarator
        rgen = np.random.RandomState(self.random_state)

        # rgen.normal(~) 이용하여 표준 편차가 0.01인 정규 분포에서 뽑은 랜덤한 작은 수 저장
        self.w_ = rgen.normal(loc=0.0, scale=0.01, size=1 + X.shape[1])

        self.errors_ = []

        '''
        fit 메서드는 

        1. 가중치 초기화 후 훈련 세트에 있는 모든 샘플을 반복 순회하며 퍼셉트론 학습 규칙에 따라 가중치 업데이트
        2. 가중치 업데이트 위해 predict 메서드 호출하여 클래스 레이블에 대한 예측 얻음
        '''
        for _ in range(self.n_iter):
            errors = 0

            for xi, target in zip(X, y):
                update = self.eta * (target - self.predict(xi))
                self.w_[1:] += update * xi
                self.w_[0] += update
                errors += int(update != 0.0)

            self.errors_.append(errors)

        return self

    def net_input(self, X):
        # 최종 입력 계산
        return np.dot(X, self.w_[1:])+self.w_[0]

    def predict(self, X):
        # 단위 계단 함수를 사용하여 클래스 레이블 반환
        return np.where(self.net_input(X) >= 0.0, 1, -1)

* self.w_ 가중치를 0으로 초기화하지 않는 이유?

가중치가 0이 아니어야 학습률 eta가 분류 결과에 영향을 줌. 가중치가 0으로 초기화되어 있다면 eta는 가중치 벡터의 크기에만 영향을 미침.

'Artificial Intelligence > Studying' 카테고리의 다른 글

Logistic regression (0)	2020.12.29
Gradient descent (0)	2020.11.14
Linear regression (0)	2020.11.14
[머신러닝 교과서] Ch04 좋은 훈련 세트 만들기 : 데이터 전처리 (0)	2020.11.01
[머신러닝 교과서] Ch03 내용 정리 (아직 수정 중) (0)	2020.09.29

현재글[머신러닝 교과서] Ch02 객체지향 퍼셉트론 API 분석

nsbg 🌞

my life is nsbg

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

nsbg 🌞

[머신러닝 교과서] Ch02 객체지향 퍼셉트론 API 분석

'Artificial Intelligence > Studying' 카테고리의 다른 글

'Artificial Intelligence/Studying'의 다른글

티스토리툴바

[머신러닝 교과서] Ch02 객체지향 퍼셉트론 API 분석

'Artificial Intelligence > Studying' 카테고리의 다른 글

'Artificial Intelligence/Studying'의 다른글

관련글

티스토리툴바