Artificial Intelligence/Studying 14

[Causal Inference] 01. Introduction to causality

์ฃผ 1ํšŒ ์ง„ํ–‰ํ•˜๋Š” ์Šคํ„ฐ๋”” ๋ชจ์ž„์—์„œ ํ•จ๊ป˜ ๊ณต๋ถ€ํ•ด๋ณด๊ธฐ๋กœ ํ•œ ์ž๋ฃŒ ์ •๋ฆฌ ๋ชฉ์ ์œผ๋กœ ๊ธ€์„ ์ž‘์„ฑํ•œ๋‹ค. ์Šคํ„ฐ๋””์›๋ถ„๊ป˜์„œ ์ข‹์€ ์ž๋ฃŒ๋ฅผ ์ถ”์ฒœํ•ด์ฃผ์…”์„œ ์ •๋ง ์˜ค๋žœ๋งŒ์— ์ง„๋“ํ•œ ์ด๋ก  ๊ณต๋ถ€๋ฅผ ํ•˜๊ฒŒ ๋  ๊ฒƒ ๊ฐ™๋‹ค. ์›๋ฌธ: https://github.com/CausalInferenceLab/Causal-Inference-with-Python ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ์ธ๊ณผ๊ด€๊ณ„ โ—พ ๋จธ์‹ ๋Ÿฌ๋‹์€ ์—„๊ฒฉํ•œ ๋ฐ”์šด๋”๋ฆฌ ์•ˆ์—์„œ ์—„์ฒญ๋‚œ ์ผ์„ ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ชจ๋ธ์ด ํ•™์Šตํ•œ ๊ฒƒ๊ณผ ์กฐ๊ธˆ ๋‹ค๋ฅผ ๊ฒฝ์šฐ ์ œ๋Œ€๋กœ ์ž‘๋™ํ•˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ์Œ โ—พ ๋จธ์‹ ๋Ÿฌ๋‹์€ ์ƒ๊ด€๊ด€๊ณ„์— ์˜์กดํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ธ๊ณผ๊ด€๊ณ„(causation) ์œ ํ˜•์˜ ๋ฌธ์ œ๋ฅผ ์ž˜ ๋‹ค๋ฃจ์ง€ ๋ชปํ•จ ์˜ˆ์‹œ) "ํ˜ธํ…” ์‚ฐ์—…์—์„œ ๊ฐ€๊ฒฉ์€ ๋น„์ˆ˜๊ธฐ์ผ ๋•Œ ์ €๋ ดํ•˜๊ณ , ์ˆ˜์š”๊ฐ€ ๊ฐ€์žฅ ๋งŽ๊ณ  ํ˜ธํ…”์ด ๊ฐ€๋“ ์ฐจ๋Š” ์„ฑ์ˆ˜๊ธฐ ์‹œ์ฆŒ์—๋Š” ๊ฐ€๊ฒฉ์ด ๋†’์Šต๋‹ˆ๋‹ค. ํ•ด๋‹น ๋ฐ์ด..

์ ๋Œ€์  ๊ณต๊ฒฉ ๊ฐœ๋… ๋ฐ ์œ ํ˜•

๐Ÿ’ฌ ๊ฐœ์ธ์ด ์—ฌ๋Ÿฌ ์ž๋ฃŒ๋ฅผ ์ฐธ๊ณ ํ•˜๋ฉด์„œ ์ดํ•ดํ•œ๋Œ€๋กœ ์ •๋ฆฌํ•œ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค. ์˜คํƒ€๋‚˜ ์˜ณ์ง€ ๋ชปํ•œ ์ •๋ณด๊ฐ€ ์žˆ์„ ๊ฒฝ์šฐ ๋Œ“๊ธ€๋กœ ์•Œ๋ ค์ฃผ์„ธ์š” ๐Ÿ™‚ Adversarial Attack | ์ ๋Œ€์  ๊ณต๊ฒฉ ๊ตฌ๊ธ€๋งํ•ด๋ณด๋‹ˆ๊นŒ ์ ๋Œ€์  ๊ณต๊ฒฉ์˜ ๊ฐœ๋…์„ ํฌ๊ฒŒ ๋‘ ๊ฐ€์ง€๋กœ ์ •์˜ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ ๊ฐ™๋‹ค. ๋‘ ๊ฐœ ๋‹ค ๋งํ•˜๊ณ ์ž ํ•˜๋Š” ๋ฐ”๋Š” ๋™์ผํ•œ ๊ฒƒ์œผ๋กœ ์ดํ•ดํ–ˆ๊ณ  ํ‘œํ˜„์˜ ์ฐจ์ด๊ฐ€ ์•„๋‹๊นŒ ์‹ถ๋‹ค. 1. ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์ด ์žˆ์„ ๋•Œ ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ์— Adversarial perurbation์„ ์ ์šฉํ•˜์—ฌ Adversarial example์„ ์ƒ์„ฑํ•˜๊ณ , ๋ชจ๋ธ์ด Adversarial example์— ๋Œ€ํ•ด ์˜ค๋ถ„๋ฅ˜๋ฅผ ์ผ์œผํ‚ค๊ฒŒ ํ•˜๋Š” ๊ณต๊ฒฉ ๋ฐฉ๋ฒ•. (KISA REPORT, ์ •๋ณดํ†ต์‹ ๊ธฐํšํ‰๊ฐ€์› ์ ๋Œ€์  ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ์ˆ  ๋™ํ–ฅ์—์„œ ์ผ๋ถ€ ๋ฐœ์ทŒ) 2. ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ž์ฒด์˜ ์ทจ์•ฝ์ ์— ์˜ํ•ด ์ ๋Œ€์  ํ™˜๊ฒฝ์—์„œ ..

[Hands-on] Ch15 RNN๊ณผ CNN์„ ์‚ฌ์šฉํ•ด ์‹œํ€€์Šค ์ฒ˜๋ฆฌํ•˜๊ธฐ

15.1 ์ˆœํ™˜ ๋‰ด๋Ÿฐ๊ณผ ์ˆœํ™˜ ์ธต โ—ฝ RNN์€ ๊ฐ ํƒ€์ž„ ์Šคํ… t๋งˆ๋‹ค X(t)์™€ ์ด์ „ ํƒ€์ž„ ์Šคํ…์˜ ์ถœ๋ ฅ์ธ Y(t-1)์„ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์Œ โ—ฝ ์ฒซ๋ฒˆ์งธ ํƒ€์ž„ ์Šคํ…์€ ์ด์ „ ์ถœ๋ ฅ์ด ์—†๊ธฐ ๋•Œ๋ฌธ์— ๋ณดํ†ต 0์œผ๋กœ ์„ค์ • โ—ฝ ์‹œ๊ฐ„์„ ์ถ•์œผ๋กœ ๋‚˜ํƒ€๋‚ผ ๊ฒฝ์šฐ ์‹œ๊ฐ„์— ๋”ฐ๋ผ ๋„คํŠธ์›Œํฌ๋ฅผ ํŽผ์ณค๋‹ค๊ณ  ํ‘œํ˜„ ํ•˜๋‚˜์˜ ์ƒ˜ํ”Œ์— ๋Œ€ํ•œ ์ˆœํ™˜ ์ธต์˜ ์ถœ๋ ฅ ๋ฏธ๋‹ˆ๋ฐฐ์น˜์— ์žˆ๋Š” ์ „์ฒด ์ƒ˜ํ”Œ์— ๋Œ€ํ•œ ์ˆœํ™˜ ๋‰ด๋Ÿฐ ์ธต์˜ ์ถœ๋ ฅ 15.1.1 ๋ฉ”๋ชจ๋ฆฌ ์…€ โ—ฝ ๋ฉ”๋ชจ๋ฆฌ ์…€(๋˜๋Š” ์…€) : ํƒ€์ž„ ์Šคํ…์— ๊ฑธ์ณ ์–ด๋–ค ์ƒํƒœ๋ฅผ ๋ณด์กดํ•˜๋Š” ์‹ ๊ฒฝ๋ง์˜ ๊ตฌ์„ฑ ์š”์†Œ โ—ฝ h(t) : ํƒ€์ž„ ์Šคํ… t์—์„œ์˜ ์…€์˜ ์ƒํƒœ. ๊ทธ ํƒ€์ž„ ์Šคํ…์˜ ์ž…๋ ฅ๊ณผ ์ด์ „ ํƒ€์ž„ ์Šคํ…์˜ ์ƒํƒœ์— ๋Œ€ํ•œ ํ•จ์ˆ˜ 15.1.2 ์ž…๋ ฅ๊ณผ ์ถœ๋ ฅ ์‹œํ€€์Šค 1) ์‹œํ€€์Šค-ํˆฌ-์‹œํ€€์Šค ๋„คํŠธ์›Œํฌ : ํ•˜๋‚˜์˜ ์ž…๋ ฅ ์‹œํ€€์Šค, ํ•˜๋‚˜์˜ ์ถœ๋ ฅ ์‹œํ€€์Šค(๋„คํŠธ์›Œํฌ ์ „์ฒด๋กœ ๋ณด๋ฉด ์—ฌ๋Ÿฌ ๊ฐœ์˜..

[Hands-on] Ch18 ๊ฐ•ํ™” ํ•™์Šต(Reinforcement Learning)

๊ตฌ์กฐ ๊ฐœ๋… ์ •์ ์ธ ํ™˜๊ฒฝ์—์„œ ํ•™์Šต์„ ์ง„ํ–‰ํ•˜๋Š” ์ง€๋„/๋น„์ง€๋„ํ•™์Šต๊ณผ ๋‹ฌ๋ฆฌ, ์–ด๋–ค ํ™˜๊ฒฝ ์•ˆ์—์„œ ์ •์˜๋œ ์ฃผ์ฒด(agent)๊ฐ€ ํ˜„์žฌ์˜ ์ƒํƒœ(state)๋ฅผ ๊ด€์ฐฐํ•˜์—ฌ ์„ ํƒํ•  ์ˆ˜ ์žˆ๋Š” ํ–‰๋™(action)๋“ค ์ค‘์—์„œ ๊ฐ€์žฅ ์ตœ๋Œ€์˜ ๋ณด์ƒ(reward)์„ ๊ฐ€์ ธ๋‹ค์ฃผ๋Š”์ง€ ํ–‰๋™์„ ํ•™์Šตํ•˜๋Š” ๊ฒƒ 18.1 ๋ณด์ƒ์„ ์ตœ์ ํ™”ํ•˜๊ธฐ ์œ„ํ•œ ํ•™์Šต ์—์ด์ „ํŠธ๋Š” ๋ณด์ƒ์˜ ์žฅ๊ธฐ๊ฐ„ ๊ธฐ๋Œ€์น˜๋ฅผ ์ตœ๋Œ€๋กœ ๋งŒ๋“œ๋Š” ํ–‰๋™์„ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์„ ๋ชฉ์ ์œผ๋กœ ํ•จ 18.2 ์ •์ฑ… ํƒ์ƒ‰ 1) ์ •์ฑ…์˜ ๊ฐœ๋… โ—ฝ ์—์ด์ „ํŠธ๊ฐ€ ํ–‰๋™์„ ๊ฒฐ์ •ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜ โ—ฝ ์—์ด์ „ํŠธ๊ฐ€ ์–ด๋–ค ์ƒํƒœ์—์„œ ํ–‰๋™์„ ์ทจํ•˜๊ฒŒ ๋  ๋•Œ ์ƒํƒœ์— ๋งž๊ฒŒ ์ทจํ•  ์ˆ˜ ์žˆ๋Š” ํ–‰๋™์„ ์—ฐ๊ฒฐํ•ด ์ฃผ๋Š” ํ•จ์ˆ˜ 2) ํ™•๋ฅ ์  ์ •์ฑ… โ—ฝ ์–ด๋–ค ์ƒํƒœ์— ๋Œ€ํ•œ ํ–‰๋™๋“ค์˜ ํ™•๋ฅ ๋ถ„ํฌ๋ฅผ ๋ฐ˜ํ™˜ 3) ์œ ์ „ ์•Œ๊ณ ๋ฆฌ์ฆ˜ โ—ฝ ์ ์ž์ƒ์กด ์ด๋ก ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ์ตœ์ ํ™” ๊ธฐ๋ฒ• โ—ฝ ๋ถ€๋ชจ์™€ ..

[Hands-on] Ch17-9 (2) GAN ๋ชจ๋ธ

DCGAN ๊นŠ์€ ํ•ฉ์„ฑ๊ณฑ(Deep Convolution) ์ธต์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํฐ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•œ GAN 1) Guideline โ—ฝ ํŒ๋ณ„์ž์˜ ํ’€๋ง ์ธต → stride convolution์œผ๋กœ ๊ต์ฒด โ—ฝ ์ƒ์„ฑ์ž์˜ ํ’€๋ง ์ธต → fractional-strided convolution์œผ๋กœ ๊ต์ฒด โ—ฝ ์ƒ์„ฑ์ž์˜ ์ถœ๋ ฅ์ธต๊ณผ ํŒ๋ณ„์ž์˜ ์ž…๋ ฅ์ธต์„ ์ œ์™ธํ•œ ๋ชจ๋“  ์ธต์— Batch Normalization ์ ์šฉ โ—ฝ ์ธต์„ ๊นŠ๊ฒŒ ์Œ“๊ธฐ ์œ„ํ•ด ์™„์ „ ์—ฐ๊ฒฐ ์€๋‹‰์ธต ์ œ๊ฑฐ โ—ฝ tanh ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ด์•ผ ํ•˜๋Š” ์ถœ๋ ฅ์ธต์„ ์ œ์™ธํ•˜๊ณ  ์ƒ์„ฑ์ž์˜ ๋ชจ๋“  ์ธต์— ReLU ํ™œ์„ฑํ™” ํ•จ์ˆ˜ ์ ์šฉ โ—ฝ ํŒ๋ณ„์ž์˜ ๋ชจ๋“  ์ธต์— LeakyReLU ํ™œ์„ฑํ™” ํ•จ์ˆ˜ ์‚ฌ์šฉ 2) ํ•œ๊ณ„ DCGAN์œผ๋กœ ๋งค์šฐ ํฐ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•  ๊ฒฝ์šฐ ํŠน์ง•์€ ๊ตฌ๋ถ„๋˜์ง€๋งŒ ์ „๋ฐ˜์ ์œผ๋กœ ์ผ๊ด€์„ฑ ์—†๋Š” ์ด๋ฏธ์ง€๋ฅผ ์–ป์„ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์Œ..

[Hands-on] Ch17-9 (1) ์ƒ์„ฑ์  ์ ๋Œ€ ์‹ ๊ฒฝ๋ง

์ƒ์„ฑ์ž(Generator) ๋žœ๋คํ•œ ๋ถ„ํฌ(์ผ๋ฐ˜์ ์œผ๋กœ ๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ)๋ฅผ ์ž…๋ ฅ ๋ฐ›๊ณ  ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ ์ธ์Šคํ„ด์Šค ์ƒ์„ฑ. ๋ณ€์ดํ˜• ์˜คํ† ์ธ์ฝ”๋”์˜ ๋””์ฝ”๋”์™€ ๊ฐ™์€ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•˜์ง€๋งŒ ํ›ˆ๋ จ ๋ฐฉ์‹์ด ํฌ๊ฒŒ ๋‹ค๋ฅด๋‹ค. ํŒ๋ณ„์ž(Discriminator) ์ƒ์„ฑ์ž๋กœ๋ถ€ํ„ฐ ์–ป์€ ๊ฐ€์งœ ๋ฐ์ดํ„ฐ๋‚˜ ํ›ˆ๋ จ ์„ธํŠธ์—์„œ ์ถ”์ถœํ•œ ์ง„์งœ ๋ฐ์ดํ„ฐ๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„ ์ž…๋ ฅ๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ง„์งœ์ธ์ง€ ๊ฐ€์งœ์ธ์ง€ ๊ตฌ๋ณ„ํ•œ๋‹ค. ์ž‘๋™ ๋ฐฉ์‹ ํŒ๋ณ„์ž๊ฐ€ ๋” ์ด์ƒ ๊ฐ€์งœ๋กœ ํŒ์ •ํ•˜์ง€ ์•Š๋Š” ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑ์ž๊ฐ€ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์„ ๋•Œ๊นŒ์ง€, ์ƒ์„ฑ์ž์™€ ๊ฐ๋ณ„์ž๋Š” ์„œ๋กœ ๊ฒฝ์Ÿํ•˜๋ฉด์„œ ํ›ˆ๋ จํ•˜๊ฒŒ ๋œ๋‹ค. ํ›ˆ๋ จ์„ ์„ฑ๊ณต์ ์œผ๋กœ ๋งˆ์น˜๋ฉด ์ƒ์„ฑ์ž๊ฐ€ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋กœ ์ƒˆ๋กœ์šด ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ๋งŒ๋“ค์–ด์„œ ๋‹ค๋ฅธ ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง์— ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜๋„ ์žˆ๋‹ค. ์ถœ์ฒ˜: https://kr.mathworks.com/ ํ›ˆ๋ จ ๋ฐฉ์‹ ๋ชฉํ‘œ๊ฐ€ ๋‹ค๋ฅธ ๋‘ ๋„คํŠธ์›Œ..

Convolutional Neural Network

CNN - ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜์— ๋งŽ์ด ์‚ฌ์šฉ๋˜๋ฉฐ convolutional layer / pooling layer(์ƒ๋žตํ•˜๊ธฐ๋„ ํ•จ)๋กœ ๊ตฌ์„ฑ Convolutional layer ๐Ÿ“Œ ํ•„ํ„ฐ๋Š” ์ด๋ฏธ์ง€์˜ ํŠน์ง•์„ ์ฐพ์•„๋‚ด๊ธฐ ์œ„ํ•œ ๊ณต์šฉ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ kernel์ด๋ผ๊ณ  ๋ถ€๋ฅด๊ธฐ๋„ ํ•จ Stride - ํ•„ํ„ฐ ์ ์šฉ ๊ฐ„๊ฒฉ ex) stride=1 : 1์นธ์”ฉ ์ด๋™, stride=2 : 2์นธ์”ฉ ์ด๋™ Output - ์ž…๋ ฅ ๋ฐ์ดํ„ฐ ํฌ๊ธฐ, ํ•„ํ„ฐ ํฌ๊ธฐ, stride๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ 1+(์ž…๋ ฅ ํฌ๊ธฐ-ํ•„ํ„ฐ ํฌ๊ธฐ)/stride - output feature map ์ฑ„๋„ ์ˆ˜ = convolution ํ•„ํ„ฐ ์ˆ˜ ๐Ÿ“Œ ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ ์ˆ˜ํ–‰ ์‹œ ๊ฐ€์ค‘์น˜ ์ •ํ•˜๋Š” ๋ฒ• โ‘  ๋žœ๋ค ๊ฐ’์œผ๋กœ ์ดˆ๊ธฐํ™” โ‘ก ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šต Padding - ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ ์ˆ˜ํ–‰ ์ „ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ ์ฃผ๋ณ€์„ ํŠน์ •..

Logistic regression

Classification binary classification : variable is either 0 or 1 Logistic vs Linear - Logistic regression์„ ์ ์šฉํ•˜๊ธฐ ์œ„ํ•œ ๋ฐ์ดํ„ฐ๋“ค์€ ์ด์‚ฐ์ (๊ตฌ๋ถ„์ด ๋ช…ํ™•ํ•จ) - Linear regression์€ ์—ฐ์†์  - 0, 1 ํ˜•ํƒœ๋กœ ๊ฐ’์„ ์–ป๊ณ  ์‹ถ์„ ๋•Œ Linear regression์€ ๋ฐ”๋กœ ์–ป์„ ์ˆ˜ ์—†๊ณ  ๋‹ค๋ฅธ ์‹์„ ํ•„์š”๋กœ ํ•จ Sigmoid(Logistic) function - ์ค‘๊ฐ„ ๊ฐ’์€ 0.5 - ๊ณ„๋‹จ ํ˜•์‹์˜ ํ•จ์ˆ˜๋ฅผ ๋ฏธ๋ถ„์ด ๊ฐ€๋Šฅํ•œ ๊ณก์„  ํ˜•ํƒœ๋กœ ๋ฐ”๊พธ์–ด์ฃผ๋Š” ์—ญํ•  - Binary classification → ๋งˆ์ง€๋ง‰ ๋ ˆ์ด์–ด ํ™œ์„ฑํ•จ์ˆ˜๋กœ ์‚ฌ์šฉ Decision Boundary - ์ด์ง„ ํด๋ž˜์Šค ๋˜๋Š” ๋‹ค์ค‘ ํด๋ž˜์Šค ๋ถ„๋ฅ˜ ๋ฌธ์ œ์—์„œ ๋ชจ๋ธ์ด ํ•™์Šตํ•œ ํด๋ž˜์Šค..

Gradient descent

* ์‹ค์Šต ์†Œ์Šค ์ฝ”๋“œ : github.com/nsbg/AI Concept - ๊ฒฝ์‚ฌ๋ฅผ ๋”ฐ๋ผ ๋‚ด๋ ค๊ฐ€๋ฉด์„œ ์ตœ์ €์ ์„ ์ฐพ๋„๋ก ์„ค๊ณ„๋œ ์•Œ๊ณ ๋ฆฌ์ฆ˜ - ์ตœ์ ํ™” : ์ด๋“ ์ตœ๋Œ€ํ™”, ์†์‹ค ์ตœ์†Œํ™” - cost ํ•จ์ˆ˜์—์„œ cost๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” W, b๋ฅผ ์ฐพ๋Š” ๊ฒƒ How it works 1) ์ถ”์ •์„ ํ†ตํ•ด W, b ์„ค์ •(์–ด๋–ค ๊ฐ’์ด๋“  ์ƒ๊ด€์—†์Œ) 2) cost๊ฐ€ ์กฐ๊ธˆ์”ฉ ์ค„์–ด๋“ค๋„๋ก W, b ๊ฐ’ ์—…๋ฐ์ดํŠธ 3) ์ตœ์ €์ ์— ๋„๋‹ฌํ–ˆ๋‹ค๊ณ  ํŒ๋‹จ๋  ๋•Œ๊นŒ์ง€ ๊ณผ์ • 2) ๋ฐ˜๋ณต ∴ ๊ณก์„  ์ƒ์—์„œ ์ž„์˜์˜ ํ•œ ์ง€์ ์„ ์ •ํ•œ ํ›„ ์ด ์ ์—์„œ์˜ ๊ธฐ์šธ๊ธฐ(Gradient)๋ฅผ ๊ตฌํ•˜๊ณ , ๊ฐ€์ค‘์น˜ W์™€ ๊ธฐ์šธ๊ธฐ๋ฅผ ๊ณฑํ•œ ๊ฐ’์„ W์—์„œ ๋นผ์คฌ์„ ๋•Œ ๊ทธ ๊ฒฐ๊ณผ๊ฐ’์ด ๋‹ค์Œ ๊ฐ€์ค‘์น˜ W(์–ด๋–ค ์ ์—์„œ ์‹œ์ž‘ํ•ด๋„ ๊ฒฐ๊ณผ๊ฐ’์€ ๋™์ผ) Formal definition Batch(GPU๊ฐ€ ํ•œ๋ฒˆ์— ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐ์ดํ„ฐ ๋ฌถ์Œ)..