music/audio processing library Librosa ์ฌ์ฉ๋ฒ Tutorial
(2) Audio data representations (Spectogram, Mel-spectogram)
(4) Audio feature processing
(3)์์ ์ถ์ถํ Audio feature์ ๊ฐ์ง๊ณ ์ถ๊ฐ์ ์ธ processing์ ํ์ฌ ์ํํ task์ ์ฑ๋ฅ์ ๋์ผ ์ ์๋ค.
Using Delta and Double-delta
Feature์ delta(1์ฐจ ์ฐจ๋ถ)์ double-delta(2์ฐจ ์ฐจ๋ถ) ๊ฐ๋ค์ ์ด์ฉํ ์ ์๋ค.
์๋ ์ฝ๋๋ 13-dim mean mfcc์ delta์ double-delta๋ฅผ ๊ตฌํด 39 ์ฐจ์ feature๋ฅผ ๋ง๋๋ ์์ ์ด๋ค.
y, sr = librosa.load(librosa.ex('trumpet'))
mfcc = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13)
mfcc_delta = librosa.feature.delta(mfcc)
mfcc_delta2 = librosa.feature.delta(mfcc, order=2)
feature = np.concatenate((mfcc.mean(axis=1),
mfcc_delta.mean(axis=1),
mfcc_delta2.mean(axis=1)))
๋ฐ์ํ