DeepSeek

새로 출시된 GLM-Image는 오픈 소스 AI 개발자에게 더 이상 Nvidia와 CUDA가 필요하지 않다는 개념 증명입니다.

익명엔지니어2135·1개월 전·조회 195

Zhipu는 방금 GLM-Image를 오픈 소스로 제공했으며, 최고 독점 모델의 이미지 품질과 완전히 동등하지는 않지만 Nvidia 칩 및 CUDA 없이도 경쟁력 있는 오픈 소스 모델을 구축하고 훈련할 수 있음을 보여줍니다.

GLM-Image는 전적으로 교육을 받았습니다.
Huawei Ascend 910B 칩(SOTA Ascend 910C도 아님) 및 MindSpore 프레임워크. Ascend 칩은 Nvidia 칩보다 효율성이 80%에 불과하기 때문에 더 많은 칩이 필요하지만 비용이 훨씬 저렴하기 때문에 오픈 소스 개발자는 교육 중에 많은 비용을 절약할 수 있습니다. Nvidia의 H100 칩 가격은 개당 30~40,000달러인 반면 Ascend 910B의 가격은 개당 12~13,000달러입니다. 또한 910B는 H100보다 약 절반의 전력이 필요합니다.

단 90억 개의 매개변수만으로 GLM-Image는 소비자급 하드웨어에서 고속 추론을 실행할 수 있으므로 오픈 소스 스타트업이 훨씬 더 저렴하게 사용할 수 있습니다.

이러한 개념 증명이 주요 벤치마크에서 독점 모델과 경쟁하는 오픈 소스 모델로 이어질지는 아직 알 수 없지만 오픈 소스 AI는 앞으로 큰 발전을 이루었습니다.