์์:
(1) LSTM
(3) Show, Attend and Tell
reference: colah.github.io/posts/2015-08-Understanding-LSTMs/
Recurrent Neural Network
๊ธฐ๋ณธ์ ์ธ RNN์ ๊ตฌ์กฐ๋ ์์ ๊ฐ๋ค. ์ด์ ์ state๋ฅผ ํจ๊ป input์ผ๋ก ์ฃผ์ด ์ด์ input๊ณผ์ ์ฐ๊ด์ฑ์ ํจ๊ป ํ์ตํด ๋๊ฐ๋ค.
ํ์ง๋ง ์ด๋ฌํ ๊ตฌ์กฐ๋, input์ ๊ธธ์ด๊ฐ ๊ธธ์ด์ง์๋ก, ๋คํธ์ํฌ์ ๋ท๋ถ๋ถ์ผ๋ก ๊ฐ ์๋ก ์ ๋ถ๋ถ์ ์ ๋ณด๋ฅผ ์์ด๋ฒ๋ฆฌ๋ ๋ฌธ์ ์ ์ด ์๋ค.
LSTM์ ์ด๋ฌํ ๋ฌธ์ ์ ์ ๊ทน๋ณตํ๊ธฐ ์ํด ์ ์๋์๋ค.
Long Short Term Memory
์๋ ๊ฐ๋จํ RNN์ ๊ตฌ์กฐ, ์๋๋ LSTM์ ๊ตฌ์กฐ์ด๋ค. ๊ฐ ๊ธฐํธ์ ์๋ฏธ๋ ๋ค์๊ณผ ๊ฐ๋ค.
The Core Idea Behind LSTM
LSTM์์ ํต์ฌ์ด ๋๋ ์์ด๋์ด๋ Cell state์ด๋ค. LSTM์์ Cell state์ ํ๋ฆ๋ง ๋ณด๋ฉด, ๊ฐ๋จํ ์ ํ ์ฐ์ฐ๋ง์ด ๊ฐํด์ง๋ฉด์ ๋ค์ state๋ก ์ ๋ณด๊ฐ ์ ๋ฌ๋๋ค.
LSTM์ gate๋ผ๊ณ ๋ถ๋ฆฌ๋ ๊ตฌ์กฐ๋ฅผ ํตํด ๋ค์ cell๋ก ํ๋ฅผ ์ ๋ณด์ ์์ ์ ์ดํ๋ค. Sigmoid layer์ ๊ฑฐ์น ๊ฐ์ด ๊ณฑํด์ง๋ ๊ตฌ์กฐ๋ก ๋์ด ์๋ค.
Sigmoid๋ 0๋ถํฐ 1 ์ฌ์ด์ ๊ฐ์ ์ถ๋ ฅํ๋ฏ๋ก, ์ด๋ '์ผ๋งํผ์ ์ ๋ณด๋ฅผ cell state์ ์ ๋ฌํ ์ง'๋ฅผ ๊ฒฐ์ ํ๋ ์ญํ ์ ํ๋ค.
์๋ฅผ ๋ค์ด sigmoid๋ฅผ ๊ฑฐ์น ๊ฐ์ด 0์ด ๋๋ค๋ฉด '๋ค์ cell๋ก ์ ๋ณด๋ฅผ ์ ๋ฌํ์ง ์์'์ ์๋ฏธํ๊ณ ,sigmoid๋ฅผ ๊ฑฐ์น ๊ฐ์ด 1์ด ๋๋ค๋ฉด '๋ชจ๋ ์ ๋ณด๋ฅผ ๊ทธ๋๋ก ์ ๋ฌํจ'์ ์๋ฏธํ๊ฒ ๋๋ค.
LSTM์ 3๊ฐ์ gate๋ฅผ ํฌํจํ๊ณ ์๊ณ , ๊ฐ๊ฐ์ ์๋ฏธ์ ๋ํด ์์๋ณด๊ฒ ๋ค.
Three Gates of LSTM
์ฒซ ๋ฒ์งธ gate๋ ์ด์ cell state์์ ๋ค์ cell state๋ก ์ ๋ฌํ ์ ๋ณด์ ์์ ๊ฒฐ์ ํ๋ ์ญํ ์ ํ๋ค.
์ด์ cell์ hidden state์ ์ด๋ฒ cell์ input ๊ฐ์ ์ด์ฉํด 0๋ถํฐ 1 ์ฌ์ด ๊ฐ์ ์ถ๋ ฅํ๊ณ , ์ด๋ฅผ ์ด์ cell state์ ๊ณฑํด์ค๋ค.
๋ ๋ฒ์งธ gate๋ ๋ค์ cell state์ ์ถ๊ฐํ ์ ๋ณด๋ฅผ ๊ฒฐ์ ํ๋ ์ญํ ์ ํ๋ค.
Tanh layer์ ํตํด cell state์ ํ๋ณด(candidate value)๊ฐ ๋๋ ๊ฐ์ ๊ฒฐ์ ํ๊ณ ,sigmoid layer์ ํตํด ์ด ํ๋ณด ๊ฐ ์ค ์ด๋ค ๊ฐ์ ์ผ๋งํผ ์ถ๊ฐํ ๊ฒ์ธ์ง๋ฅผ ๊ฒฐ์ ํ๋ค.๋ ๊ฐ์ ๊ณฑํด cell state์ ๋ํด์ค๋ค.
๋ง์ง๋ง์ผ๋ก hidden state ๊ฐ์ ๊ฒฐ์ ํ๋ค. Cell state๊ฐ ๋ค์ cell๋ก ๊ณ์ ํ๋ฌ๊ฐ๋ ๊ฐ์ด๋ผ๋ฉด, hidden state๋ ์ผ๋ฐ์ ์ธ CNN์์์ ๊ฐ์ด ์ค๊ฐ layer์ output ๊ฐ์ด๋ค. Hidden state๋ cell์ output์ผ๋ก ์ถ๋ ฅ๋๊ธฐ๋ ํ๊ณ , ๋ค์ cell๋ก ์ ๋ฌ๋๊ธฐ๋ ํ๋ค.
๋ ๋ฒ์งธ layer๊ณผ ๋ฐ๋ ๊ณผ์ ์ ๊ฑฐ์น๋ค.
Cell state์ ๊ฐ์ tanh layer์ ํต๊ณผ์์ผ ๊ฐ์ ์ถ์ถํ๊ณ ,
sigmoid layer์ ํตํด ์ด๋ค ๊ฐ์ ์ผ๋งํผ ์ฌ์ฉํ ๊ฒ์ธ์ง๋ฅผ ๊ฒฐ์ ํ๋ค.
๋ ๊ฐ์ ๊ณฑํด ๋ค์ hidden state์ ๊ฐ์ ๊ฒฐ์ ํ๋ค.
-
๊ฐ๋จํ ์ ๋ฆฌํ๋ฉด, gate์์ tanh layer์ ์ ๋ณด๋ฅผ ์ถ์ถํ๋ ์ญํ ์ ํ๊ณ ,
sigmoid layer์ ์ฌ์ฉํ ์ ๋ณด์ ์์ ๊ฒฐ์ ํ๋ ์ญํ ์ ํ๋ ๊ฒ ๊ฐ๋ค.
'๐ Deep Learning > Overview' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[StyleGAN ์๋ฆฌ์ฆ] ProGAN/PGGAN, StyleGAN, StyleGAN2 (0) | 2022.08.19 |
---|---|
[GAN Overview] GAN ์ฃผ์ ๋ชจ๋ธ ์ ๋ฆฌ (GAN survey ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ) (0) | 2022.01.23 |
[Overview] Attention ์ ๋ฆฌ - (2) seq2seq, +attention (0) | 2021.01.26 |
[Overview] YOLO ๊ณ์ด Object Detection ์ ๋ฆฌ - (1) YOLO (0) | 2021.01.19 |
[Overview] R-CNN ๊ณ์ด Object Detection ์ ๋ฆฌ (Two-stage detector) (0) | 2021.01.08 |