์ฃผ 1ํ ์งํํ๋ ์คํฐ๋ ๋ชจ์์์ ํจ๊ป ๊ณต๋ถํด๋ณด๊ธฐ๋ก ํ ์๋ฃ ์ ๋ฆฌ ๋ชฉ์ ์ผ๋ก ๊ธ์ ์์ฑํ๋ค. ์คํฐ๋์๋ถ๊ป์ ์ข์ ์๋ฃ๋ฅผ ์ถ์ฒํด์ฃผ์ ์ ์ ๋ง ์ค๋๋ง์ ์ง๋ํ ์ด๋ก ๊ณต๋ถ๋ฅผ ํ๊ฒ ๋ ๊ฒ ๊ฐ๋ค.
์๋ฌธ: https://github.com/CausalInferenceLab/Causal-Inference-with-Python
๋จธ์ ๋ฌ๋๊ณผ ์ธ๊ณผ๊ด๊ณ
โพ ๋จธ์ ๋ฌ๋์ ์๊ฒฉํ ๋ฐ์ด๋๋ฆฌ ์์์ ์์ฒญ๋ ์ผ์ ํ ์ ์์ง๋ง, ์ฃผ์ด์ง ๋ฐ์ดํฐ๊ฐ ๋ชจ๋ธ์ด ํ์ตํ ๊ฒ๊ณผ ์กฐ๊ธ ๋ค๋ฅผ ๊ฒฝ์ฐ ์ ๋๋ก ์๋ํ์ง ์์ ์ ์์
โพ ๋จธ์ ๋ฌ๋์ ์๊ด๊ด๊ณ์ ์์กดํ๊ธฐ ๋๋ฌธ์ ์ธ๊ณผ๊ด๊ณ(causation) ์ ํ์ ๋ฌธ์ ๋ฅผ ์ ๋ค๋ฃจ์ง ๋ชปํจ
์์) "ํธํ ์ฐ์ ์์ ๊ฐ๊ฒฉ์ ๋น์๊ธฐ์ผ ๋ ์ ๋ ดํ๊ณ , ์์๊ฐ ๊ฐ์ฅ ๋ง๊ณ ํธํ ์ด ๊ฐ๋ ์ฐจ๋ ์ฑ์๊ธฐ ์์ฆ์๋ ๊ฐ๊ฒฉ์ด ๋์ต๋๋ค. ํด๋น ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ก์ ๋, ๋จธ์ ๋ฌ๋์ ์์งํ ์์ธก(Naive predicition)์์๋ ๊ฐ๊ฒฉ์ ์ธ์ํ๋ฉด, ๋ ๋ง์ ๊ฐ์ค์ด ํ๋ฆด ๊ฒ์ด๋ผ๊ณ ์ ์ํ ์ ์์ต๋๋ค. (์ธ๊ณผ๊ด๊ณ)"
โพ '์ฐ๊ด(association)'์ด ์ธ๊ณผ๊ด๊ณ๋ ์๋์ง๋ง, ๊ทธ ์ด์ ์ ๋ํด ์ค๋ช ํ๋ ๊ฒ์ ์ข ๋ ๋ณต์กํจ
์ฐ๊ด์ฑ์ด ์ธ๊ณผ๊ด๊ณ๊ฐ ๋ ๋
โ Notation
$ T_i $: unit i (์คํ๋์ i)์ ๋ํ Treatment(์ฒ์น, ํจ๊ณผ๋ฅผ ์๊ณ ์ ํ๋ ์ผ๋ถ ๊ฐ์ ์ ๋ํ๋ด๋๋ฐ ์ฌ์ฉํ ์ฉ์ด) ์ฌ๋ถ
$ Y_i $: unit i์ ๋ํด ๊ด์ฐฐ๋ ๊ฒฐ๊ณผ ๋ณ์
$ Y_0i $: unit i๊ฐ Treatment๋ฅผ ๋ฐ์ง ์์ ์ ์ฌ์ ๊ฒฐ๊ณผ
$ Y_1i $: $ Y_0i $์์์ unit i์ ๋์ผํ unit i๊ฐ Treatment๋ฅผ ๋ฐ์ ์ ์ฌ์ ๊ฒฐ๊ณผ
โพ ์ธ๊ณผ์ ์ถ๋ก ์ ๊ทผ๋ณธ์ ์ธ ๋ฌธ์ (Fundamental problem of causal inference)๋ Treatment๊ฐ ์๋ ์๋ ๊ฐ์ ์คํ ๋์์ ๋ํด ๋์์ ๊ด์ฐฐํ ์ ์์
โพ ํ๋ธ๋ฆฟ-ํ์ ์ฑ์ทจ ์์ ์ ์ ์ฉํด๋ณด๊ธฐ
โพ ์ ์ฌ์ ๊ฒฐ๊ณผ๋ฅผ ํตํด ๊ฐ๋ณ ์ฒ์น ํจ๊ณผ(ITE, Individual Treatment Effect) $ Y_1i-Y_0i $๋ฅผ ์ ์ํ ์ ์์
โพ ITE ์ ์๋ ๊ฐ๋ฅํ์ง๋ง ๊ฐ์ ์คํ ๋์์ ๋ํด ์ ์ฌ์ ๊ฒฐ๊ณผ๋ฅผ ํ๋ ๋ฐ์ ๊ด์ฐฐํ ์ ์๋ ์ธ๊ณผ์ถ๋ก ์ ๊ทผ๋ณธ์ ๋ฌธ์ ๋ก ์ธํด ITE๋ฅผ ์ ์๋ ์์
โพ ITE๋ฅผ ์ง์ ์ถ์ ํ๋ ๊ฒ ๋์ , ํ๊ท ์ฒ์น ํจ๊ณผ(ATE, Average Treatment Effect) $ E[Y_1-Y_0] $์ ์ถ์ ์ด ๋ ์ฌ์
โพ ์ฒ์น๋ฐ์ ๊ทธ๋ฃน์ ๋ํ ํ๊ท ์ฒ์น ํจ๊ณผ(ATET/ATT, average treatment effect on the treated) $ E[Y_1-Y_0|T=1] $์ ์ถ์ ์ด ์ข ๋ ์ฌ์
Bias
๐ญ ํ๋ธ๋ฆฟ ์์์์์ ํธํฅ์ด ์ ํํ ๋ญ๊น?
โพ 'ํธํฅ'์ ์ฐ๊ด์ฑ์ ์ธ๊ณผ๊ด๊ณ์ ๋ค๋ฅด๊ฒ ๋ง๋ฆ → Bias๋ ์คํ๊ตฐ๊ณผ ๋์กฐ๊ตฐ์ด ์ฒ์น๋ฅผ ๋ฐ์ง ์์ ๊ฒฝ์ฐ, ์ฒ์น ์ ์ ์คํ๊ตฐ๊ณผ ๋์กฐ๊ตฐ์ด ์ด๋ป๊ฒ ๋ค๋ฅธ์ง๋ฅผ ๋ํ๋
โพ ์ ์ฌ์ ๊ฒฐ๊ณผ ํ๊ธฐ๋ฒ์์ ์ฒ์น๋ฐ์ $ Y_0 $์ ์ฒ์น๋ฐ์ง ์์ $ Y_0 $๋ ๋ค๋ฆ → ์ฒ์น๋ฐ์ $ Y_0 $์ ๋ฐ์ฌ์ค
โพ ์ฐ๊ด์ฑ = ํ๋ธ๋ฆฟ์ด ์๋ ํ๊ต์ ํ๊ท ์ํ ์ ์-ํ๋ธ๋ฆฟ์ด ์๋ ํ๊ต์ ํ๊ท ์ํ ์ ์=$ E[Y|T=1]-E[Y|T=0] $
โพ ์ธ๊ณผ๊ด๊ณ = $ E[Y_1-Y_0] $
โพ ์ฐ๊ด์ฑ ์ธก์ ํ ๊ด์ฐฐ๋ ๊ฒฐ๊ณผ๋ฅผ ์ ์ฌ์ ๊ฒฐ๊ณผ๋ก ๋์ฒดํ ๊ฒฝ์ฐ, $ E[Y|T=1]-E[Y|T=0] = E[Y_1|T=1]-E[Y_0|T=0] $
โพ $ E[Y_0|T=0]=E[Y_0|T=1] $์ด๋ฉด
= ์ฐ๊ด์ฑ์ ์ธ๊ณผ๊ด๊ณ์ ๊ฐ์
= ์คํ๊ตฐ๊ณผ ๋์กฐ๊ตฐ์ด ๋น๊ต ๊ฐ๋ฅํจ
= ์คํ๊ตฐ์ด ์ฒ์น๋ฅผ ๋ฐ์ง ์์์ ๋ $ Y_0 $๋ฅผ ๊ด์ฐฐํ ์ ์๋ค๋ฉด ๊ทธ ๊ฒฐ๊ณผ๋ ์ฒ์น๋ฅผ ๋ฐ์ง ์์ ๊ฒ๊ณผ ๋์ผํจ
= ๊ฒฐ๊ณผ์ ์ผ๋ก ํธํฅ ํญ์ด ์ฌ๋ผ์ง
โพ ๋น๊ต ๊ฐ๋ฅํ ๊ทธ๋ฃน์ผ ๊ฒฝ์ฐ ๋ ์ง๋จ์ ํ๊ท ์ฐจ์ด๊ฐ ์ธ๊ณผํจ๊ณผ๊ฐ ๋จ
'Artificial Intelligence > Studying' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์ ๋์ ๊ณต๊ฒฉ ๊ฐ๋ ๋ฐ ์ ํ (0) | 2022.01.04 |
---|---|
[Hands-on] Ch15 RNN๊ณผ CNN์ ์ฌ์ฉํด ์ํ์ค ์ฒ๋ฆฌํ๊ธฐ (0) | 2021.08.18 |
[Hands-on] Ch18 ๊ฐํ ํ์ต(Reinforcement Learning) (0) | 2021.08.09 |
[Hands-on] Ch17-9 (2) GAN ๋ชจ๋ธ (0) | 2021.08.02 |
[Hands-on] Ch17-9 (1) ์์ฑ์ ์ ๋ ์ ๊ฒฝ๋ง (0) | 2021.07.16 |