Bagging μ€μ΅νλ€κ° λ°μ΄ν°μ λΆν μμ λλ¬Έμ μλ¬ λ©μμ§λ₯Ό λ§λ μ μ΄ μλλ°(λ¬΄λ € λ λ¬ μ ) μ΄μ μμΌ μ 리νλ€.
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_breast_cancer
import numpy as np
λ°μ΄ν°λ λ λ¬ μ μ μΌλ κ±° κ·Έλλ‘ λΆλ¬μκ³ νμν λͺ¨λλ§ importν΄μ€¬λ€.
μμ€μ½μ μ λ°©μ μ§λ¨ λ°μ΄ν°μ μλ μ΄ 569κ°μ λ°μ΄ν°κ° μλ κ²μ νμΈνλ€.
X_train, X_test, y_train, y_test = train_test_split(dataset.data, dataset.target)
train_test_splitμ μ¨μ λ°μ΄ν°μ μ λλλλ°, μμμ μ€μμ±λ§ νμΈνκΈ° μν μ€μ΅μ΄λ―λ‘ μ΄λ€ μΈμλ μ€μ νμ§ μκ³ λλ λ°μ΄ν°λ§ λ£μ΄μ£Όμλ€.
β test_size κ°μ μ νμ§ μμ κ²½μ° defaultμΈ 0.25κ° μ μ©λ¨
κ²°κ³Ό
1) X_train, X_test, y_train, y_test
- test_size κΈ°λ³Έ κ°μ΄ 0.25λκΉ μ 체 λ°μ΄ν°μ 25%λ₯Ό ν μ€νΈ λ°μ΄ν°λ‘ μ΄λ€λ λ»μ΄λ€.
- 569*0.25 = 142.25 → X, y λͺ¨λ 143κ°μ ν μ€νΈ λ°μ΄ν°
2) X_train, y_train, X_test, y_test
- train_test_splitμΌλ‘ λΆν ν λ°μ΄ν°λ λ³μμ μ§μ μμλλ‘ λ€μ΄κ°λλ° trainλΌλ¦¬, testλΌλ¦¬ λ¬Άμ΄λ²λ¦¬λ©΄ X, y λͺ¨λ μ 체 λ°μ΄ν°λ₯Ό trainμ©μΌλ‘λ μ°κ³ testμ©μΌλ‘λ μ΄λ€λ λ»μ΄ λΌλ²λ¦°λ€.
- λ°μ΄ν°μ μ λλ μ§κ² μ§λ§ κ³Όκ±°μ λ΄κ° κ·Έλ¬λ κ²μ²λΌ μν μκ° μ λ§λ€λ μλ¬λ₯Ό λ§μ£Όν μ μλ€.
κ²°λ‘
train_test_split μ¬μ© μ train, test μμλ‘ λ°μ΄ν°λ₯Ό λ£μ΄μ£Όμ΄μΌ νλ€!
μ°Έκ³ μ¬μ΄νΈ
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
'Artificial Intelligence > π' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[μ 리] Numpy β‘ : squeeze (0) | 2022.04.20 |
---|---|
[μ 리] Numpy β : shape, ndim, axis (0) | 2022.04.19 |
[κ°λ ] ν¬μ νν / λ°μ§ νν (0) | 2022.03.10 |
[μ 리] Encoding κ΄λ ¨ API (0) | 2022.01.28 |
[κ°λ ] object detection κ΄λ ¨ μ©μ΄ μ 리 (1) (0) | 2021.11.16 |