스펙트로그램 3

[Python/파이썬] 목소리와 음악을 구분하자 - 2편(with Resnet)

안녕하세요. 오늘은 이전 글인 목소리와 음악을 구분하자 1편에 이어 2편을 시작하겠습니다. 이전 글을 보고 오시지 않으셨으면, 아래의 글을 통해 읽고 오시면 되겠습니다. 2023.07.25 - [Python] - [Python/파이썬] 목소리와 음악을 구분하자 - 1편(with Spleeter) [Python/파이썬] 목소리와 음악을 구분하자 - 1편(with Spleeter) 오늘은 음성데이터에서 존재하는 음악과 목소리를 분류하는 작업을 진행하려 합니다. 이를 위해서 저는 두 가지 방법을 거쳐 진행하였습니다. Spleeter를 통해서 음성 데이터의 mr을 진행했습니다 studyblog4244.tistory.com 1. 목소리 출현 구간 탐색 멘트인 구간을 찾기 위해서 우리는 먼저 멘트가 아닌 컨텐츠의 ..

Python 2023.08.01

[Python/파이썬] 목소리와 음악을 구분하자 - 1편(with Spleeter)

오늘은 음성데이터에서 존재하는 음악과 목소리를 분류하는 작업을 진행하려 합니다. 이를 위해서 저는 두 가지 방법을 거쳐 진행하였습니다. Spleeter를 통해서 음성 데이터의 mr을 진행했습니다. - 이러한 이유는, 음성 데이터에 존재하는 목소리만을 추출해야했기 때문입니다. 음성 데이터(제가 사용하는 라디오 음성 데이터 기준)는 크게 나누면 멘트, 광고, 노래 컨텐츠가 존재합니다. 이러한 컨텐츠는 각자 특징이 있고 저는 이 컨텐츠를 분리해야 했습니다. 가장 먼저 시도한 것은, 단순히 음성 데이터를 스펙트로그램으로 변환하여 제가 제작한 CNN 모델에 학습을 시켜 나중의 데이터에 대해서 예측하는 방법입니다. 스펙트로그램은 시간에 따라서 변하는 주파수를 시각화한 것이라고 이해하시면 편합니다. (주파수란, 일정..

Python 2023.07.25

[Python/파이썬] 스펙트로그램으로 노래의 구간을 찾아보자

안녕하세요. 오늘은 스펙트로그램을 통해서 해시값을 추출한 후에, 두 노래가 어느 구간에서 일치율이 높은지를 알아보는 코드를 소개하려합니다. 즉, 전체 노래가 DB에 저장되어 있고, 인식되는 노래가 DB의 어느 노래와 일치하는지, 그리고 그 노래의 어떤 부분에서 일치하는지를 확인하는 코드를 소개해드립니다. (설명을 생략하고 코드만 궁금하신 분들은 하단으로 내리시면 확인하실 수 있습니다.) 설명에 앞서 아래의 모든 내용은, Shazam의 논문에 근거하여 작성된 글을 바탕으로 작성됨을 미리 알려드립니다. 이 코드는 "Shazam"에서 오픈 소스로 공개된 코드를 기반으로 구성했습니다. 샤잠에서는 스펙트로그램을 통해서 peak point를 추출하고, 해당 peak point를 통해서 해시값을 구성합니다. 이런 해..

Python 2023.07.20