광고 영역 320x100
LocalLLaMA

Qwen-Image-2.0 출시 - 네이티브 2K 및 실제 텍스트 렌더링을 갖춘 7B 통합 생성+편집 모델

익명엔지니어3070·1개월 전·조회 401

Qwen 팀은 방금 Qwen-Image-2.0을 출시했습니다. 누군가 묻기 전에 아직 공개 가중치가 없으며 Alibaba Cloud(베타 초대)의 API 전용이며 Qwen Chat의 무료 데모입니다. 그러나 Qwen-Image v1(출시 후 한 달 정도 무게가 감소함, Apache 2.0)에 대한 기록을 고려할 때 이것이 오랫동안 닫혀 있으면 놀랄 것입니다.

그래서 거래는 무엇입니까?

* v1의 20B에서 7B 모델로 하향되어 현지 러너들에게 희소식입니다.
* 하나의 파이프라인에서 생성 + 편집 통합, 별도의 모델 필요 없음
* 네이티브 2K(2048×2048), 실제로 좋아 보이는 사실적인 텍스처
* 프롬프트의 텍스트 렌더링은 최대 1,000개 토큰입니다. 인포그래픽, 포스터, 슬라이드, 심지어 중국 서예까지. 오픈랩에서 본 것 중 아마도 최고의 텍스트 인 이미지일 것입니다.
* 일관된 캐릭터를 갖춘 다중 패널 만화 생성(4×6)

7B 크기는 여기서 흥미로운 부분입니다. 가중치가 떨어지면 소비자 하드웨어에서 매우 실행 가능해야 합니다. 20B의 V1은 이미 ComfyUI에서 인기가 있었으며, 더 적은 비용으로 더 많은 작업을 수행하는 7B 버전이 바로 지역 커뮤니티에 필요한 것입니다.

호피움을 웨이트 릴리스에 투입하기 전에 테스트하고 싶다면 Qwen Chat에 데모가 있습니다.


광고 영역 320x100
0댓글
광고 영역 320x100