๐ŸŒŒ Deep Learning/DL & ML ์กฐ๊ฐ ์ง€์‹

MSE Loss (L2 Loss) vs. MAE Loss (L1 Loss)

๋ณต๋งŒ 2021. 1. 19. 17:19

heartbeat.fritz.ai/5-regression-loss-functions-all-machine-learners-should-know-4fb140e9d4b0

์˜ ์ผ๋ถ€๋ฅผ ๋ฒˆ์—ญ & ์š”์•ฝํ•œ ๊ธ€

 

MSE Loss and MAE Loss

MSE(Mean Squared Loss, L2 Loss)๋Š” Error์˜ ์ œ๊ณฑ์˜ ํ‰๊ท ์„ ๋‚ธ ๊ฐ’์ž…๋‹ˆ๋‹ค. ์ˆ˜์‹์œผ๋กœ ๋‚˜ํƒ€๋‚ด๋ฉด ์•„๋ž˜์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค.

๋‹ค์Œ์€ True value๋ฅผ 100์ด๋ผ๊ณ  ํ–ˆ์„ ๋•Œ Predicted value๋ฅผ -10,000์—์„œ 10,000๊นŒ์ง€ ๋ณ€ํ™”์‹œ์ผœ ๊ฐ€๋ฉฐ ๊ทธ๋ฆฐ ๊ทธ๋ž˜ํ”„์ž…๋‹ˆ๋‹ค. x์ถ•์€ Predicted value, y์ถ•์€ MSE Loss์˜ ๊ฐ’์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

 

MAE(Mean Absolute Loss, L1 Loss)๋Š” Error์˜ ์ ˆ๋Œ€๊ฐ’์˜ ํ‰๊ท ์„ ๋‚ธ ๊ฐ’์ž…๋‹ˆ๋‹ค. ์ˆ˜์‹์œผ๋กœ ๋‚˜ํƒ€๋‚ด๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

๋‹ค์Œ์€ True value๋ฅผ 100์ด๋ผ๊ณ  ํ–ˆ์„ ๋•Œ Predicted value๋ฅผ -10,000์—์„œ 10,000๊นŒ์ง€ ๋ณ€ํ™”์‹œ์ผœ ๊ฐ€๋ฉฐ ๊ทธ๋ฆฐ ๊ทธ๋ž˜ํ”„์ž…๋‹ˆ๋‹ค. x์ถ•์€ Predicted value, y์ถ•์€ MAE Loss์˜ ๊ฐ’์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

 

MSE Loss์™€ MAE Loss ๋ชจ๋‘ Predicted value๊ฐ€ True value์™€ ๊ฐ™์„ ๋•Œ ์ตœ์†Œ๊ฐ’์„ ๊ฐ€์ง€๊ณ , Loss๊ฐ’์€ 0๋ถ€ํ„ฐ ๋ฌดํ•œ๋Œ€์˜ ๋ฒ”์œ„๋ฅผ ๊ฐ€์ง‘๋‹ˆ๋‹ค.

 

 

MSE vs. MAE

๊ฒฐ๋ก ๋ถ€ํ„ฐ ๋งํ•˜์ž๋ฉด, ์ตœ์ ๊ฐ’์„ ๊ตฌํ•˜๊ธฐ์—๋Š” MSE๊ฐ€ ์ข‹์ง€๋งŒ, MAE๊ฐ€ outlier(์ด์ƒ์น˜)์— ๋œ ์˜ํ–ฅ์„ ๋ฐ›์Šต๋‹ˆ๋‹ค.

 

MAE์˜ ๊ฒฝ์šฐ, loss๊ฐ€ ํฌ๋˜ ์ž‘๋˜ ํ•ญ์ƒ gradient๊ฐ€ ์ผ์ •ํ•ฉ๋‹ˆ๋‹ค. Loss๊ฐ€ ์ž‘์•„๋„ gradient๋Š” ์ž‘์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— ๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•(gradient descent)๋ฅผ ์‚ฌ์šฉํ•ด ์ตœ์ ๊ฐ’์„ ์ฐพ๋Š” ๋ฐ์— ์–ด๋ ค์›€์ด ์กด์žฌํ•ฉ๋‹ˆ๋‹ค.

์ด์— ๋น„ํ•ด MSE๋Š” loss๊ฐ€ ํฌ๋ฉด gradient๋„ ํฌ๊ณ , loss๊ฐ€ ์ž‘์œผ๋ฉด gradient๋„ ์ž‘๊ธฐ ๋•Œ๋ฌธ์— ์ตœ์ ๊ฐ’์„ ์ฐพ๋Š” ๊ฒƒ์ด ๋ณด๋‹ค ์ˆ˜์›”ํ•ฉ๋‹ˆ๋‹ค.

 

 

๋‹ค๋งŒ, ๋‹ค๋ฅธ ๊ฐ’๋“ค์— ๋น„ํ•ด ํ›จ์”ฌ ํฐ ๊ฐ’์ด๋‚˜ ์ž‘์€ ๊ฐ’์ธ ์ด์ƒ์น˜๊ฐ€ ์กด์žฌํ•˜๋Š” ๊ฒฝ์šฐ MAE๊ฐ€ ๋” ์˜ํ–ฅ์„ ์ ๊ฒŒ ๋ฐ›์Šต๋‹ˆ๋‹ค.

๊ทธ ์˜ˆ์‹œ๋กœ ์•„๋ž˜ ํ‘œ์—์„œ ์™ผ์ชฝ์€ ์ด์ƒ์น˜๊ฐ€ ์—†๋Š” ๊ฒฝ์šฐ, ์˜ค๋ฅธ์ชฝ์€ ์ด์ƒ์น˜๊ฐ€ ์กด์žฌํ•˜๋Š” ๊ฒฝ์šฐ์ž…๋‹ˆ๋‹ค. ๊ฐ๊ฐ์˜ ๊ฒฝ์šฐ์—์„œ MAE์™€ RMSE(MSE์— Root๋ฅผ ์ทจํ•œ ๊ฐ’)๋ฅผ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค. (*MSE ๋Œ€์‹  RMSE๋ฅผ ์‚ฌ์šฉํ•œ ์ด์œ ๋Š” MAE์™€ scale์„ ๋งž์ถฐ ์ฃผ๊ธฐ ์œ„ํ•จ์ž„)

 

์ด์ƒ์น˜๊ฐ€ ์กด์žฌํ•˜๋Š” ๊ฒฝ์šฐ RMSE๋Š” ์˜ํ–ฅ์„ ํฌ๊ฒŒ ๋ฐ›์•„ ๊ฐ’์ด ๋งค์šฐ ์ปค์ง„ ๊ฒƒ์— ๋น„ํ•ด, MAE๋Š” ์ฐจ์ด๊ฐ€ ๋œํ•ฉ๋‹ˆ๋‹ค.

๊ทธ ์ด์œ ๋Š” Error์— ์ œ๊ณฑ์„ ์ทจํ•˜๋Š” MSE์˜ ๊ฒฝ์šฐ ๊ทธ ๊ณผ์ •์—์„œ Error๊ฐ€ ์ฆํญ๋˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. 

 

 

๋”ฐ๋ผ์„œ Train data์— ์ด์ƒ์น˜๊ฐ€ ์กด์žฌํ•˜๋Š” ๊ฒฝ์šฐ MAE Loss๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด ์ข‹์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋˜ํ•œ, MSE Loss๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ›ˆ๋ จํ•œ ๊ฒฝ์šฐ, ์˜ˆ์ธก๊ฐ’์€ ์ •๋‹ต ๊ฐ’๋“ค์˜ ํ‰๊ท ์„ ์˜๋ฏธํ•˜๊ณ , 

MAE Loss๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ›ˆ๋ จํ•œ ๊ฒฝ์šฐ, ์˜ˆ์ธก๊ฐ’์€ ์ •๋‹ต ๊ฐ’๋“ค์˜ ์ค‘์•™๊ฐ’์„ ์˜๋ฏธํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ฐ˜์‘ํ˜•