์์:
(1) YOLO (2016)
(2) YOLOv2
(3) YOLOv3
(4) YOLOv4
YOLO (2016)
Redmon, Joseph, et al. "You only look once: Unified, real-time object detection." Proceedings of the IEEE conference on computer vision and pattern recognition. 2016.
Paper: www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Redmon_You_Only_Look_CVPR_2016_paper.pdf
Official code: pjreddie.com/darknet/yolo/
๋ ผ๋ฌธ์์ ์ ์ํ ๋ชจ๋ธ ๊ตฌ์กฐ๋ ์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์. 448*448*3 Input์ ๋ฐ์ 7*7*30 Output์ ์ถ๋ ฅํ๋ค.
Activation function์ผ๋ก๋ alpha=0.1์ธ LeackyReLU๋ฅผ ์ฌ์ฉํ๋ค๊ณ ํ๋ค.
Input Image๋ฅผ S*S grid๋ก ๋๋๊ณ , ๊ฐ๊ฐ์ grid cell์ ๋ํด
๊ฐ grid cell์ ์ค์ฌ์ผ๋ก ํ๋ Bounding box coordinate x, y, w, h์ ๊ฐ box์ confidence Pr(object)๋ฅผ ๊ณ์ฐํ๊ณ --> B*5
๊ฐ grid cell์ ๋ํ Class probability map Pr(Class_i)์ ๊ณ์ฐํ๋ค. -> C
B: ์์ธกํ Bounding box์ ๊ฐ์ (๋
ผ๋ฌธ์์๋ 2๊ฐ)
C: Class ๊ฐ์ (๋
ผ๋ฌธ์์๋ 20๊ฐ)
* bbox confidence๋ class์ ๋ํ confidence๊ฐ ์๋๋ผ, object๊ฐ ์๋์ง ์๋์ง์ ๋ํ confidence์.
๊ฐ ๊ตฌ์กฐ๋ฅผ ๋ ์์ธํ ์ดํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
1) ๊ฐ grid cell์ channel๋ณ ๊ฐ์ ์ดํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
- ์ฒซ 5๊ฐ์ channel์ ์ฒซ ๋ฒ์งธ bbox์ ์ขํ์ confidence, ๋ค์ 5๊ฐ์ channel์ ๋ ๋ฒ์งธ bbox์ ์ขํ์ confidence๋ฅผ ๋ํ๋ด๋ฉฐ ๋ง์ง๋ง 20๊ฐ์ channel์ ํด๋น grid cell์ ๊ฐ class์ ๋ํ probability๋ฅผ ๋ํ๋.
2) ๊ฐ bbox์ Class probability map์ ๊ตฌํ๋ค.
- ๊ฐ bbox์ object probability Pr(object)์ ํด๋น grid cell์ class probability map Pr(class_i)๋ฅผ ๊ณฑํ๋ฉด bbox์ class probability map์ ์ป์ ์ ์๋ค.
Grid cell ๋น bbox๊ฐ ๋ ๊ฐ์ฉ ์์ผ๋ฏ๋ก ์ด 7*7*2 ๊ฐ์ vector์ ์ป์
3) ์๊ณ ๋ฆฌ์ฆ์ ํตํด bbox๋ฅผ ๊ฒฐ์ ํ๋ค.
ํ์ต ๋ฐฉ๋ฒ์, ์์ 20๊ฐ์ convolution layer์ ImageNet์ ์ด์ฉํด pretrain ์ํค๊ณ , ์ง์ ์ ์ํ Loss function์ ์ด์ฉํด ๋๋จธ์ง๋ฅผ ํ์ต์์ผฐ๋ค.
ํ์ต์ ์ฌ์ฉํ Loss function์ ๋ค์๊ณผ ๊ฐ๋ค.
x, y (bbox ์ค์ ์ขํ), w, h (bbox์ ๋๋น์ ๋์ด), C (bbox์ object๊ฐ ์กด์ฌํ ํ๋ฅ ), p_i(c) (๊ฐ class์ ์ํ ํ๋ฅ ) ์ error์ ๊ฐ๊ฐ ๊ณ์ฐํด ๋ํ๋ค.
๊ฐ๋จํ MSE์ ๊ฑฐ์ ์ ์ฌํ์ง๋ง, ๋ค๋ฅธ ์ ์ ๊ฐ ํญ๋ชฉ๋ง๋ค ๊ฐ์ค์น๋ฅผ ์ฃผ์๋ค๋ ์ ์ด๋ค.
- Localization error๊ณผ classification error์ ์๋ก ๋ค๋ฅธ ๊ฐ์ค์น๋ฅผ ์ฃผ์์.
- Object๊ฐ ์๋ cell์ ๊ฐ์๊ฐ ํจ์ฌ ๋ง๊ธฐ ๋๋ฌธ์, ์ด์ชฝ์ผ๋ก gradient๊ฐ ์น์ฐ์น๋ ๊ฒ์ ๋ฐฉ์งํ๊ธฐ ์ํด object๊ฐ ์๋ cell๊ณผ ์๋ cell์ ๊ฐ์ค์น๋ฅผ ๋ค๋ฅด๊ฒ ์ฃผ์์.
- Box์ ํฌ๊ธฐ๊ฐ ํด ์๋ก error๊ฐ ๋ฏธ์น๋ ์ํฅ์ด ์์์ผ ํ๋ฏ๋ก, width์ height์ error์ ์ธก์ ํ ๋์๋ root๋ฅผ ์์ ์ค.
'๐ Deep Learning > Overview' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[StyleGAN ์๋ฆฌ์ฆ] ProGAN/PGGAN, StyleGAN, StyleGAN2 (0) | 2022.08.19 |
---|---|
[GAN Overview] GAN ์ฃผ์ ๋ชจ๋ธ ์ ๋ฆฌ (GAN survey ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ) (0) | 2022.01.23 |
[Overview] Attention ์ ๋ฆฌ - (2) seq2seq, +attention (0) | 2021.01.26 |
[Overview] Attention ์ ๋ฆฌ - (1) LSTM (0) | 2021.01.26 |
[Overview] R-CNN ๊ณ์ด Object Detection ์ ๋ฆฌ (Two-stage detector) (0) | 2021.01.08 |