광고 영역 320x100
Stable Diffusion

LTX 2는 놀랍습니다 : RTX 3060 12GB의 ComfyUI의 LTX-2

익명창작자3017·1개월 전·조회 1,054

내 설정: RTX 3060 12GB VRAM + 48GB 시스템 RAM.

지난 며칠 동안 ComfyUI에서 **LTX-2**를 가지고 놀았는데 정말 재미있었어요. 네온에 젖은 비 내리는 다카**를 배경으로 한 느슨한 **스파이 스토리(비 오는 거리, 우산, 극적인 반사, 신비한 여성 주인공이 있는 사이버펑크/방글라 분위기의 느슨한** 샘플 장면)를 만들었습니다.

워크플로 : https://drive.google.com/file/d/1VYrKf7jq52BIi43mZpsP8QCypr9oHtCO/view
게시물 아래에 공유한 사용자 이름을 잊어버렸습니다. 이 워크플로는 정말 잘 작동했습니다!

8초짜리 장면을 생성하는 데 약 **12분**이 걸렸습니다(오디오 동기화 포함). 저는 총 **70개 이상의 장면**을 대기열에 넣었고, 분위기를 맞추기 위해 장면당 3~4개의 프롬프트 변형을 시도하기도 했습니다. 일부 장면은 순수 텍스트에서 비디오로, 다른 장면은 일관성을 위해 제가 생성한 미드 여정 스틸 사진에서 시작하여 이미지에서 비디오로 전환했습니다.

다음은 제가 가장 좋아하는 몇 가지 클립 모음입니다(비오는 창문에 비친 모습, 커피 증기가 얼굴로 변하는 모습, 붐비는 네온 마켓을 걷는 모습, 폭우 속 강렬한 클로즈업):

오디오를 정리했습니다. 삐걱거리는 소리가 좀 났어요.

저를 놀라게 한 강점: ** **

1. **속도** - 특히 다른 로컬 비디오 모델에 비해 매우 빠릅니다.
2. **오디오 동기화**는 정말 인상적입니다. 일러스트 스타일, 애니메이션풍의 외형, 사실적인 캐릭터, 인형/기묘한 추상적 형태까지 테스트했는데 립싱크, 앰비언트 비, 미묘한 SFX/음악 모두 예상보다 훨씬 더 잘 어울렸습니다. 단 **12GB VRAM**으로 이 정도 수준의 품질을 구현하는 것은 정말 대단한 일입니다.
3. **비사실적/추상적 콘텐츠를 매우 잘 처리** - 일러스트, 양식화된/인형 같은 인물, 초현실적 요소(수증기가 얼굴을 형성하거나 과장된 비 효과 등)가 일관성 있고 아름답게 나옵니다.

**약점/피해야 할 사항: **

1. 가끔 이상한 무작위 줌인 효과가 나타납니다(프롬프트 관련인지 모델 특성인지 확실하지 않음).
2. **액션/모션이 많은 장면**은 아직 안정적으로 작동하지 않습니다. 미묘한 움직임, 표정, 분위기, 비, 증기, 천천히 걷기 등 동적인 것은 일관성을 깨뜨리는 경향이 있습니다. - 동적인 것은 일관성을 깨뜨리는 경향이 있습니다.

종합 평가: 말 그대로 이틀이 어떻게 사라졌는지 믿을 수 없을 정도로 프롬프트를 반복하고 대기열을 보는 것이 너무 재미있었어요. 특히 고퀄리티 액션보다는 분위기 있고 일러스트적인 스타일을 선호한다면 LTX-2는 국내 오디오-비디오 세대를 위한 큰 진전처럼 느껴집니다.


광고 영역 320x100
0댓글
광고 영역 320x100