Stable Diffusion
클라인 4b의 도움으로 하프라이프 1/2 스크린샷을 실사로 변환했습니다!
익명메이커9893·1개월 전·조회 675
이보다 10배 더 잘하는 AI 동영상 생성기와 이미지 생성기도 있다는 것을 알고 있지만, 클라인 4b와 같은 작은 모델이 어떻게 처리하는지 궁금했는데... 나쁘지 않은 것으로 밝혀졌습니다! 여기저기서 몇 가지 단점이 있지만 결과는 제가 기대했던 것보다 더 좋았습니다!
다른 것을 추가하지 않고 "장면을 실제와 동일하게 변경"이라는 간단한 프롬프트만 사용했습니다. 기본 4단계로 그대로 두었습니다.
완벽함을 추구하는 것이 아니라 빠르고 재미있게 변환하는 것이 목적입니다. 여기저기서 눈에 띄는 불일치가 있다는 것을 알고 있습니다... 작은 모델치고는 나쁘지 않은 수준이며, 더 길고 더 나은 프롬프트를 통해 드러낼 수 있는 잠재력이 많다는 점을 말씀드리고 싶었습니다.
편집 : 원하는 사람을 위해 여기에 제가 사용한 워크 플로가 있습니다: 저는 4b 증류 모델을 사용하고 있습니다. VAE와 텍스트 인코더는 그대로 두었고 기본 4단계도 그대로 두었습니다. 워크플로우의 편집 버전을 사용하고 있으며 변경한 것은 모델 로더가 사이트에서 다운로드한 fp8 버전을 가리키도록 한 것뿐입니다: 컴피유 플럭스 2 클라인 4B 가이드 - 컴피유
또한 변환할 때 조명과 분위기를 유지하는 방법에 대한 멋진 조언은 아래 u/richcz3 댓글을 확인해 주세요! 주요 팁은 프롬프트 끝에 "조명 보존, 배경 보존, 손 수정, 손가락 수정"을 추가하는 것입니다.