Artificial Intelligence/๐Ÿ“–

[๊ฐœ๋…] Crossentropy

geum 2021. 5. 26. 16:08

crossentropy

์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ๊ณผ ๋‹ค๋ฅด๊ฒŒ ์ด๋ฆ„์—๋Š” ํšŒ๊ท€๊ฐ€ ๋“ค์–ด๊ฐ€์ง€๋งŒ ์‹ค์ œ๋กœ๋Š” ๋ถ„๋ฅ˜ ๋ฌธ์ œ์ธ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€์— ์‚ฌ์šฉ๋˜๋Š” ์†์‹คํ•จ์ˆ˜๊ฐ€ crossentropy์ด๋‹ค.

 

 

binary_crossentropy

x = [-2.2, -1.4, -0.8, 0.2, 0.4, 0.8, 1.2, 2.2, 2.9, 4.6] ์ธ X๊ฐ€ ์žˆ์„ ๋•Œ ๊ฐ ์ ์— ์•„๋ž˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ๋นจ๊ฐ„์ƒ‰ ํ˜น์€ ์ดˆ๋ก์ƒ‰์˜ ์ƒ‰์ƒ์„ ๋ถ€์—ฌํ•œ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž. 

 

์ถœ์ฒ˜ - https://towardsdatascience.com

 

์šฐ๋ฆฌ๊ฐ€ ํ•ด๊ฒฐํ•ด์•ผ ๋ถ„๋ฅ˜ ๋ฌธ์ œ๋Š” X(feature)๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ ๊ทธ ์ ์˜ ์ƒ‰์ƒ(label)์„ ๋งž์ถ”๋Š” ๊ฒƒ์œผ๋กœ ๋ช…ํ™•ํ•ด์ง„๋‹ค. ๋นจ๊ฐ„์ƒ‰๊ณผ ์ดˆ๋ก์ƒ‰ ๋‘˜ ์ค‘ ํ•˜๋‚˜์˜ ๊ฒฝ์šฐ๋กœ ๋ถ„๋ฅ˜๋ฅผ ํ•˜๋Š” ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์— ์ด์ง„ ๋ถ„๋ฅ˜์— ํ•ด๋‹นํ•˜๋ฉฐ ์œ„ ์˜ˆ์‹œ์—์„œ๋Š” ์ดˆ๋ก์ƒ‰์„ 1, ๋นจ๊ฐ„์ƒ‰์„ 0์ด๋ผ๊ณ  ํ•œ๋‹ค. ๋ชจ๋“  X ์š”์†Œ์— ๋Œ€ํ•ด ๊ฐ๊ฐ์˜ ์š”์†Œ๊ฐ€ ์ดˆ๋ก์ƒ‰์ผ ํ™•๋ฅ (p)๊ณผ ๋นจ๊ฐ„์ƒ‰์ผ ํ™•๋ฅ (1-p)๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ์†์‹คํ•จ์ˆ˜๊ฐ€ binary_crossentropy๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค.

 

binary_crossentropy ์‚ฌ์šฉ ์‹œ ๋ชจ๋ธ์˜ ๋งˆ์ง€๋ง‰ dense๋ฅผ 2๋กœ ํ•ด์ฃผ์ง€ ์•Š์œผ๋ฉด ์—๋Ÿฌ๊ฐ€ ๋œจ๊ธฐ ๋•Œ๋ฌธ์— ๋ชจ๋“  ๋ ˆ์ด์–ด๋ฅผ ์Œ“๊ณ  ๋‚˜์„œ ๋งˆ์ง€๋ง‰์— ๋‘ ๊ฐˆ๋ž˜๋กœ ๋‚˜์˜ฌ ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“ค์–ด์ค˜์•ผ ํ•œ๋‹ค. (์›๋ฌธ: https://peterleeeeee.github.io/categorical_cross_entropy/)

 

categorical_crossentropy

ํด๋ž˜์Šค๊ฐ€ 3๊ฐœ ์ด์ƒ์ธ Multi-class ๋ถ„๋ฅ˜ ์‹œ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ label์ด ์›-ํ•ซ ๋ฒกํ„ฐ ํ˜•ํƒœ๋กœ ์ œ๊ณต๋  ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ์†์‹คํ•จ์ˆ˜

 

sparse_categorical_crossentropy

Multi-class ๋ถ„๋ฅ˜ ์‹œ์— ์‚ฌ์šฉ๋œ๋‹ค๋Š” ์ ์ด categorical_crossentropy์™€ ๋™์ผํ•˜์ง€๋งŒ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ label์ด ์ •์ˆ˜ํ˜•์ผ ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ์†์‹คํ•จ์ˆ˜