광고 영역 320x100
Stable Diffusion

LTX-2 오디오 입력 i2v(4× ~20초 클립)로 '스쿨 오브 락' 장면을 재현했습니다.

익명메이커3884·1개월 전·조회 429

이건 솔직히 내 마음을 날려 버렸어, 나는 이것을 기대하지 않았다.

이 LTX-2 ComfyUI 오디오 입력 + i2v 흐름을 사용했습니다 (모든 크레딧은 OP에 제공됨):
https://www.reddit.com/r/StableDiffusion/comments/1q6ythj/ltx2_audio_input_and_i2v_video_4x_20_sec_clips/

내가 한 일은 오디오를 4 부분으로 나누고 i2v로 각 부분을 개별적으로 생성 한 다음 4 개의 클립을 함께 스티칭 한 것입니다.
첫 번째로 시도한 것부터 시작해서 전체가 되었습니다.

스틸/이미지는 Z-image와 FLUX 2로 제작했습니다.
GPU: RTX 4090.

프롬프트는 말 그대로 자유롭게 스타일링했습니다:
"뱀파이어가 완벽한 립싱크로 대사를 말하면서..." 또는 "괴물이 기타 파트에 맞춰 스트링을 치면서..."와 같은 문장을 작성하는 데 도움이 되었습니다.


광고 영역 320x100
0댓글
광고 영역 320x100