오늘은 음성데이터에서 존재하는 음악과 목소리를 분류하는 작업을 진행하려 합니다. 이를 위해서 저는 두 가지 방법을 거쳐 진행하였습니다. Spleeter를 통해서 음성 데이터의 mr을 진행했습니다. - 이러한 이유는, 음성 데이터에 존재하는 목소리만을 추출해야했기 때문입니다. 음성 데이터(제가 사용하는 라디오 음성 데이터 기준)는 크게 나누면 멘트, 광고, 노래 컨텐츠가 존재합니다. 이러한 컨텐츠는 각자 특징이 있고 저는 이 컨텐츠를 분리해야 했습니다. 가장 먼저 시도한 것은, 단순히 음성 데이터를 스펙트로그램으로 변환하여 제가 제작한 CNN 모델에 학습을 시켜 나중의 데이터에 대해서 예측하는 방법입니다. 스펙트로그램은 시간에 따라서 변하는 주파수를 시각화한 것이라고 이해하시면 편합니다. (주파수란, 일정..