2016๋ IEEE TMI์ ๊ฐ์ ๋ ๋ ผ๋ฌธ์ธ "Loss Functions for Image Restoration with Neural Networks"๋ฅผ ์ ๋ฆฌํ ๊ธ์ด๋ค.
Super-resolution, artifact removal, denoising ๋ฑ Image restoration task์์ ์ฐ์ด๋ Loss function์ ๋ํด ๋ถ์ํ๊ณ , Image restoration task์์ ์ข์ ์ฑ๋ฅ์ ๋ผ ์ ์๋ ์๋ก์ด, ๋ฏธ๋ถ๊ฐ๋ฅํ loss function์ ์ ์ํ๋ค.
๊ฝค ์๋ ๋ ผ๋ฌธ์ด์ง๋ง, ์ฝ๊ธฐ ์ฝ๊ณ ์ ๋ช ํ ๋ ผ๋ฌธ์ด๋ผ ์ ๋ฆฌํด ๋ณด๋ ค๊ณ ํ๋ค.
1. Background
Image restoration
Image restoration์ด๋, denoising, deblurring, demosaicking, super-resolution ๋ฑ์ ํฌํจํ๋ค.
๋ง์ ์ฐ๊ตฌ๋ค์ด ์งํ๋์ด ์์ง๋ง, ์ด์ ๊น์ง์ ์ฐ๊ตฌ๋ ์ ๋ถ network์ ๊ตฌ์กฐ๋ฅผ tuningํ๋ ๋ฐ์ focus๊ฐ ๋ง์ถฐ์ ธ ์์๊ณ , loss layer์๋ ํฐ ๊ด์ฌ์ ๊ฐ์ง์ง ์์์ผ๋ฉฐ ์ ๋ถ L2 loss๋ฅผ ์ฌ์ฉํ๋ค. ํ์ฌ๋ ๋๋ถ๋ถ L1 loss๋ฅผ ์ฐ๋ ๊ฒ์ผ๋ก ์๊ณ ์๋๋ฐ, ์ด ๋ ผ๋ฌธ ์ดํ๋ก ํธ๋ ๋๊ฐ ๋ฐ๋ ๊ฒ์ธ์ง ๋ชจ๋ฅด๊ฒ๋ค.
๋ณธ ๋ ผ๋ฌธ์์๋ Loss function์ด Image restoration task์ ์ฑ๋ฅ์ ํฐ ์ํฅ์ ๋ผ์นจ์ ๋ณด์ธ๋ค. L2 loss๊ฐ ์๋ ๋ค๋ฅธ Loss function์ด ๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ, ์ฌ์ง์ด L2 loss๋ฅผ ์ต์ํํ๋๋ฐ์๋ ๋ค๋ฅธ Loss function์ ์ฌ์ฉํ๋ ๊ฒ์ด ๋ ์ข๋ค๊ณ ํ๋ค.
Loss functions
ํ์ฌ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ loss function์ L2 loss์ด๋ค.
๊ทธ ์ด์ ๋ L2 loss๊ฐ convexํ๊ณ differentiable ํ๋ค๋ ๊ฒ ์ธ์๋, L2 loss๊ฐ i.i.d Gaussian noise์ ๋ํด maximum likelihood ๊ฐ์ ์ ๊ณตํ๋ค๋ ์ ๋๋ฌธ์ด๋ค.
๋ํ, Caffe library์ ๊ฒฝ์ฐ, classification ์ธ์ task์ ๋ํด์๋ L2 loss๋ง์ Loss layer๋ก ์ ๊ณตํ๋ค๊ณ ํ๋ค. (์ง๊ธ์ ์๋๊ฒ ์ง.. ์ฐพ์๋ณด๊ธฐ๋ ๊ท์ฐฎ๋ค)
๊ทธ๋ฌ๋ ์ธ๊ฐ์ด ์ธ์งํ๋ ์ด๋ฏธ์ง์ ํ๋ฆฌํฐ์ L2 loss ๊ฐ๊ณผ๋ ํฐ ์ฐ๊ด์ฑ์ด ์๋ค๋ ๊ฒ์ด ์ ์๋ ค์ ธ ์๋ค. L2 loss๋ ๋จ์ง ๊ฐ pixel ๊ฐ์ ์ฐจ์ด๋ง์ ๋ณผ ๋ฟ์ด๊ณ , ์ด๋ human visual system (HVS)๊ฐ ๋์ํ๋ ๋ฐฉ์๊ณผ ๊ฑฐ๋ฆฌ๊ฐ ์๊ธฐ ๋๋ฌธ์ด๋ค.
์ด๋ฐ ์ด์ ๋ก ์ด๋ฏธ์ง์ ํ๋ฆฌํฐ๋ฅผ ์ ๋์ ์ผ๋ก ์ธก์ ํ๊ธฐ ์ํ ๋ค์ํ measurement๋ค์ด ์กด์ฌํ๋๋ฐ, SSIM, MS-SSIM ๋ฑ์ด ์๋ค. ์ด๋ค์ HVS์ ์์ฑ๋ค์ ๋ฐ์ํด ๋ณํํ IW-SSIM (Information Weighted SSIM), FSIM (Feature Similarity Index) ๋ฑ์ด ์์ผ๋, ๋ฏธ๋ถ์ด ๋ถ๊ฐ๋ฅํ๊ณ ์์์ด ์ง๋์น๊ฒ ๋ณต์กํด optimization process์ ์ฐ๊ธฐ๋ ์ ํฉํ์ง ์๋ค๊ณ ํ๋ค.
2. Experiments & Results
Loss layers for Image restoration
Image restoration task์ ๋ํด ๋ค์ํ Loss layer๋ค์ ๋ฐ๊ฟ๊ฐ๋ฉฐ ์คํํ๋ฉด์, ์ฑ๋ฅ ๋ณํ๋ฅผ ๊ด์ฐฐํ๋ค.
L2 loss๋ฅผ ์ฌ์ฉํ๋ฉด ๊ฒฐ๊ณผ ์ด๋ฏธ์ง์์ Splotcy artifacts, ์ฆ ์ผ๋ฃฉ๋๋ฃฉํด์ง๋ ๊ฒ์ ํ์ธํ ์ ์๋ค. ์ด๋ L2 loss๋ ํฐ error์ ์ค์ ์ ์ผ๋ก penalizeํ๊ณ , ์์ error์๋ tolerantํ๊ธฐ ๋๋ฌธ์ด๋ค. ๊ทธ๋ฌ๋ human visual system์ luminance์ color variation์ ๋ ๋ฏผ๊ฐํ๋ค.
L2 Loss ์ธ์ ์คํ์ ์ฌ์ฉํ Loss function๊ณผ ์์๋ค์ ๋ค์๊ณผ ๊ฐ๋ค. ์์์ ๋ํ ์์ธํ ์ค๋ช ์ ์๋ตํ๋ค.
A. L1 Error : L1 loss๋ L2 loss์ ๋ค๋ฅด๊ฒ, ํฐ error์ over-penalizeํ์ง ์๋๋ค.
B. SSIM : ์ฐ๋ฆฌ์ ๋ชฉํ๋ ์ก์์ผ๋ก ๋ดค์ ๋ ๋ ๊ทธ๋ด๋ฏํ image๋ฅผ ๋ง๋๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์, ์ด๋ฅผ ์ ๋์ ์ผ๋ก ๋ํ๋ด๋ perceptual metric์ธ SSIM์ loss function์ผ๋ก ์ด์ฉํ๋ฉด ๋ชฉํ์ ๋ถํฉํ ๊ฒ์ด๋ผ ์์ํด ๋ณผ ์ ์๋ค.
C. MS-SSIM : SSIM์ factor์ธ $\sigma_G$ ๊ฐ์ ๋ฐ๋ผ ์ฑ๋ฅ์ ํฐ ์ฐจ์ด๊ฐ ๋๋ค. MS-SSIM์ SSIM์ multi-scale version์ผ๋ก, ๋ค์ํ sigma ๊ฐ์ ๋ชจ๋ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ sigma ๊ฐ์ fine-tuning์ ํ์ง ์์๋ ๋๋ค๋ ์ฅ์ ์ด ์๋ค.
D. MS-SSIM + L1 (Mix) - Proposed method : SSIM๊ณผ MS-SSIM์ uniform bias์ sensitiveํ์ง ์๋ค๊ณ ํ๋ค. ์ด๋ brightness์ ๋ํ ๋ณํ๋, ์๊ฐ์ shift๋ฅผ ์ด๋ํ ์ ์๋๋ฐ, L1 loss๋ฅผ ํจ๊ป ์ฌ์ฉํ๋ฉด ์ด๋ฅผ ํด๊ฒฐํ ์ ์๋ค๊ณ ํ๋ค.
์ด๋ $\alpha$๋ hyperparameter๋ก, ๋ณธ ๋ ผ๋ฌธ์์๋ empiricallyํ๊ฒ $\alpha=0.84$๋ฅผ ์ฌ์ฉํ๋ค๊ณ ํ๋ค. ์ด ๊ฐ์ ๋ํ ๋ถ์์ ์งํํ์ง ์์์ผ๋, ๊ฐ์ ์์ ๋ณํ๋ ์ฑ๋ฅ์ ํฐ ์ํฅ์ ๋ผ์น์ง ์๋๋ค๊ณ ํ๋ค.
Experiments
๋ค์ํ ์ข ๋ฅ์ Image restoration task์ ๋ํด ์คํ์ ์งํํ๋ค.
์ ์ฒด ๊ฒฐ๊ณผ์ figure, ์คํ setting์ ๋ ผ๋ฌธ์์ ํ์ธํ ์ ์๋ค.
A. Joint Denoising
- image์ noise๋ฅผ ์ถ๊ฐํ ํ, ์ด๋ฅผ ์์ ๋ task์ด๋ค.
L2 loss๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ splotchy artifact๋ฅผ ํ์ธํ ์ ์์ผ๋ฉฐ,
SSIM loss๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ edge ๋ถ๋ถ์ noise๋ฅผ ํ์ธํ ์ ์๋ค.
MS-SSIM loss์ ๊ฒฝ์ฐ ์ด๋ฌํ ๋ฌธ์ ๋ค์ ํด๊ฒฐ๋์์ง๋ง ์๊ฐ์ด ์กฐ๊ธ์ฉ ์ฐจ์ด๋๋ ๋ฌธ์ ์ ์ด ์๋ค.
MS-SSIM loss์ L1 loss๋ฅผ ํจ๊ป ์ฌ์ฉํ Mix loss๊ฐ ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์๋ค.
B. Super-resolution
- image์ ํด์๋๋ฅผ ๋์ด๋ task์ด๋ค.
C. JPEG artifacts removal
- Denoising๊ณผ ์ ์ฌํ๋, JPEG compression์ผ๋ก ์์ฑ๋ artifact๋ฅผ ์์ ๋ task์ด๋ค.
D. ์ ๋์ ํ๊ฐ
- ๋ชจ๋ ์คํ๊ณผ metric์ ๋ํด Mix loss๊ฐ ๊ฐ์ฅ ๋์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒ์ ํ์ธํ ์ ์๋ค.
3. Discussion
Convergence of the loss functions
- TABLE I์ ๋ณด๋ฉด, ๊ฐ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ ๋, L1, L2, PSNR, SSIM, MS-SSIM ๋ฑ์ ๋ชจ๋ ํฌํจํด ๋ค์ํ metric์ ์ฌ์ฉํ๋ค.
- ํ ๊ฐ์ง ํน์ดํ ์ ์, L1 loss๋ฅผ ์ด์ฉํด ํ์ต์ํจ ๋ชจ๋ธ์ด L2 loss๋ฅผ ์ด์ฉํ ๋ชจ๋ธ๋ณด๋ค๋ L2 loss๊ฐ ๋ ๋ฎ์๋ค๋ ๊ฒ์ด๋ค.
- ์ด๋ ๋งค์ฐ ์์ธ๋ผ๊ณ ํ ์ ์๋ค. L2 loss๋ฅผ ์ด์ฉํ ๋ชจ๋ธ์ L2 loss๋ฅผ ๋ฎ์ถ๋ ๊ฒ๋ง์ ๋ชฉ์ ์ผ๋ก ํ์ต๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ด๋ค.
- ์ ์๋ค์ ์ด ์ด์ ๋ฅผ, L2๋ local minimum์ ๋น ์ง๊ธฐ ๋ ์ฌ์ ๊ธฐ ๋๋ฌธ์ด๋ผ๊ณ ์ถ์ธกํ๋ค.
- ์ด๋ฅผ ์ฆ๋ช ํ๊ธฐ ์ํด ๋ค์์ ์คํ์ ์งํํ๋ค.
- ๋ ๋ชจ๋ธ์ ํ์ต์ํค๋๋ฐ, ํ๋๋ L1 loss๋ก ํ์ต์ํค๋ค๊ฐ L2 loss๋ก ์ด์ด์ ํ์ต์ํจ๋ค.
- ๋ค๋ฅธ ํ๋์ ๋ชจ๋ธ์ ๋ฐ๋๋ก L2 loss๋ก ํ์ต์ํค๋ค๊ฐ L1 loss๋ก ์ด์ด์ ํ์ต์ํจ๋ค.
- ๊ทธ ๊ฒฐ๊ณผ L2 loss๋ก ํ์ต์ํค๋ค๊ฐ L1 loss๋ก ์ด์ด์ ํ์ต์์ผฐ์ ๋ loss๊ฐ ํฌ๊ฒ ๊ฐ์ํ๋ค.
- ์ด๋ L2 loss๋ก ํ์ต์์ผฐ์ ๋, local minimum์ ๊ฐํ ์์๊ธฐ ๋๋ฌธ์ด๋ผ๊ณ ํด์ํ ์ ์๋ค.
On the performance of SSIM and MS-SSIM
- TABLE I์ ๋ณด๋ฉด, SSIM๊ณผ MS-SSIM ๋ ๋ค L1 loss๋ณด๋ค ์ข์ ์ฑ๋ฅ์ ๋ด์ง ๋ชปํ๋๋ฐ, ๊ทธ ์ด์ ๋ฅผ ํฌ๊ฒ ๋ ๊ฐ์ง๋ก ๋ณผ ์ ์๋ค.
1) $\sigma_G$์ ๊ฐ์ ๋ฐ๋ผ edge์ flat region์์์ trade-off๊ฐ ๋ฐ์ํ๋ค.
- ์์ $\sigma_G$๋ฅผ ์ฌ์ฉํ๋ฉด, edge ๋ถ๋ถ์์ ๋ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ด์ง๋ง, flat region์์์ ์ฑ๋ฅ์ด ์ข์ง ์๋ค.
- ํฐ $\sigma_G$๋ฅผ ์ฌ์ฉํ๋ฉด ๋ฐ๋๋ก edge ๋ถ๋ถ์์ ์ฑ๋ฅ์ด ์ข์ง ์๊ณ flat region์์ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ธ๋ค.
2) SSIM์ uniform bias์ ๋ฏผ๊ฐํ์ง ์์ flat region, ํนํ ๋ฐ์ ๋ถ๋ถ์์ color shift๊ฐ ๋ฐ์ํ ์ ์๋ค. ์ด๋ MS-SSIM์์๋ 1)์ ๋ฌธ์ ๊ฐ ๋ฐ์ํ์ง ์์ผ๋ ์ฌ์ ํ L1 loss๋ณด๋ค ์ฑ๋ฅ์ด ๋ฎ์ ์ด์ ์ด๋ค.
- ์ด๋ฌํ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ ์ด์ ๋, SSIM๊ณผ MS-SSIM์ ์๋ grayscale image๋ฅผ ์ํด ๋์์ธ๋ metric๋ค์ด๊ธฐ ๋๋ฌธ์ด๋ค.
- color image๋ฅผ ์ํด ๋์์ธ๋ metric์ธ FSIM_c ๋ฑ์ ์ด์ฉํ ์๋ ์์ผ๋, ์ด๋ค์ ๋ฏธ๋ถ์ด ๋ถ๊ฐ๋ฅํ์ฌ Loss function์ผ๋ก ์ฌ์ฉํ๊ธฐ ํ๋ค๋ค.