이 튜토리얼에서는 스테이블 디퓨전과 디포럼을 사용하여 인상적인 AI 뮤직 비디오를 만드는 방법을 보여드리겠습니다. 이 튜토리얼은 음악 선택부터 최종 동영상 제작까지 필요한 모든 단계를 안내합니다. 이러한 도구와 약간의 창의력만 있다면 예술적으로나 기술적으로나 매력적인 나만의 예술 작품을 만들 수 있습니다.
주요 학습 내용
- 시각적 콘텐츠와 동기화하여 음악을 재생하려면 안정적인 확산과 오디오-키프레임 문자열 생성기가 필요합니다.
- 음악 트랙을 선택하고 관련 오디오 트랙을 추출하는 것은 비주얼을 제어하는 데 매우 중요합니다.
- Colab 노트북에서 매개변수를 조정하면 애니메이션의 예술적 측면을 제어하고 다듬을 수 있습니다.
단계별 가이드
AI 뮤직 비디오를 만들려면 다음 단계를 따르세요:
1단계: 음악 선택 적절한 음악을 선택하는 것으로 시작합니다. 저는 YouTube 오디오 라이브러리에서 사용할 수 있는 Nefex의 "As You Fade Away"라는 곡을 선택했습니다. 노래를 다운로드하여 제작을 시작합니다.
2단계: 오디오 편집 노래를 다운로드한 후 Phonic Mind로 이동합니다. 거기에서 오디오 트랙을 추출할 수 있는 옵션이 있습니다. 제 경우에는 드럼이 시각적 동기화에 가장 적합하기 때문에 드럼을 추출했습니다. Phonic Mind에 노래를 업로드하고 사용하려는 트랙을 선택합니다.

3단계: 키프레임 만들기 관련 드럼을 추출한 후에는 오디오 파일을 오디오-키프레임 스트링 생성기에 업로드해야 합니다. 이렇게 하면 나중에 스테이블 디퓨전에서 사용할 키프레임을 생성할 수 있습니다. 반드시 드럼 사운드만 업로드하세요.

4단계: 키프레임 매개변수 설정 이제 프레임 속도를 설정해야 합니다. 프레임을 애니메이션하기 쉽도록 초당 12프레임의 프레임 속도를 권장합니다. 또한 어떤 수학 공식을 사용할지 생각해 보세요. 여기서 줌은 특히 중요한 요소입니다. 저는 드럼 비트에 잘 어울리는 1.04의 줌으로 시작합니다.
5단계: 키프레임 문자열 복사하기 애니메이션을 만드는 데 필요한 전체 키프레임 문자열을 Stable Diffusion에서 복사합니다. 스트링을 Stable Diffusion의 Colab 노트북에 붙여넣습니다.

6단계: Colab 노트북 구성 Colab 노트북에서 기본 설정을 그대로 두어도 되지만 애니메이션의 번역 값을 조정해야 합니다. 확대/축소 비율이 올바른지, 애니메이션이 원하는 대로 보이는지 확인합니다.

7단계: 애니메이션 프롬프트 애니메이션의 시각적 테마는 프롬프트 선택이 중요합니다. 저는 사이버 펑크 스타일의 테마를 선택했습니다. Lexica에서 적합한 프롬프트를 검색하여 복사한 후 Colab 노트북에 붙여넣으세요.

8단계: 비디오 출력 설정 초당 프레임이 이전 설정과 일치해야 하므로 12로 설정되어 있는지 확인합니다. 이제 모든 셀을 실행하여 애니메이션을 생성할 수 있습니다.

9단계: 애니메이션 생성 Colab 노트북이 모든 셀을 실행하도록 합니다. 애니메이션을 생성하는 데 약 20분이 걸립니다. 모든 프레임 파일이 Google 드라이브에 저장되므로 Google 드라이브에 대한 액세스 권한을 부여하세요.

10단계: 동영상 만들기 모든 프레임이 생성되면 애니메이션을 동영상으로 변환할 수 있습니다. '모두 실행하려면 동영상 건너뛰기' 상자를 비활성화하고 재생을 클릭하여 프레임을 병합합니다.

11단계: 동영상 편집하기 동영상을 다운로드하고 선호하는 편집 프로그램에서 엽니다. 여기에서 원본 오디오 파일과 함께 동영상을 편집하여 완성된 뮤직 비디오를 얻을 수 있습니다.

동영상 요약
이 가이드에서는 스테이블 디퓨전으로 AI 뮤직 비디오를 제작하는 방법을 단계별로 설명했습니다. 오디오 트랙의 음악 선택 및 편집부터 시작하여 비디오 생성 및 편집까지 설명했습니다. 이러한 도구와 기술을 사용하면 창의적인 표현에 새로운 차원을 더하는 멋진 시각적 및 오디오 경험을 만들 수 있습니다.
자주 묻는 질문
AI 뮤직 비디오를 만들려면 무엇이 필요하나요? Stable Diffusion, Deforum, 오디오-키프레임 문자열 생성기 및 음악이 필요합니다.
오디오 트랙을 추출하려면 어떻게 하나요? Phonic Mind를 사용하여 음악 트랙에서 관련 오디오 트랙을 추출할 수 있습니다.
동영상을 생성하는 데 시간이 얼마나 걸리나요?애니메이션을 생성하는 데 프레임 수에 따라 약 20분이 소요될 수 있습니다.
어떤 동영상 편집 프로그램을 사용해야 하나요?Blender 또는 원하는 간단한 편집 프로그램 등 어떤 편집 프로그램이라도 사용할 수 있습니다.
다른 음악 트랙도 사용할 수 있나요?예. 법적으로 사용이 허용된 음악 트랙이라면 무엇이든 사용할 수 있습니다.