개요
SANA는 고효율 고해상도 이미지 및 비디오 생성을 위한 오픈 소스 코드 라이브러리로, 완전한 학습 및 추론 파이프라인을 제공합니다. Linear Diffusion Transformer를 기반으로 하여 text-to-image, text-to-video 및 world model 등의 작업을 지원합니다.
README 미리보기
\n \n\n\n\n📚 Docs | SANA | SANA-1.5 | SANA-Sprint | SANA-Video | SANA-WM | Sol-RL\n \nDemo | 🤗 HuggingFace | ComfyUI | SGLang | Cosmos-RL\n\n\n\n\n  \n  \n  \n  \n  \n\n\n\n  \n  \n\n\nICLR 2025 Oral | ICML 2025 | ICCV 2025 Highlight | ICLR 2026 Oral \n\n**SANA** is an efficiency-oriented codebase for high-resolution image and video generation, providing complete training and inference pipelines. This repository contains code for [SANA](https://nvlabs.github.io/Sana/), [SANA-1.5](https://nvlabs.github.io/Sana/Sana-1.5/), [SANA-Sprint](https://nvlabs.github.io/Sana/Sprint/), [SANA-Video](https://nvlabs.github.io/Sana/Video/), [SANA-WM](https://nvlabs.github.io/Sana/WM/), and [Sol-RL](https://nvlabs.github.io/Sana/Sol-RL/). More details can be found in our [📚 documentation](https://nvlabs.github.io/Sana/docs/).\n\nJoin our [Discord](https://discord.gg/rde6eaE5Ta) to engage in discussions with the community! If you have any questions, run into issues, or are interested in contributing, don't hesitate to reach out!\n\n\n \n\n\n## News\n\n- 🔥 [2026/05] 🌍 **SANA-WM: 2.6B Controllable World Model** is released! Supports 720p, 1-min video generation with 6-DoF camera control. A new baseline for World Modeling and Embodied AI. See [Project](https://nvlabs.github.io/Sana/WM/) | [Paper](https://huggingface.co/papers/2605.15178).\n- 🔥 [2026/04] ⚡ **Sol-RL: NVFP4 Rollout, BF16 Training RL** is available! All training recipes for **SANA**, **FLUX.1**, and **SD3.5-L**, together with bundled post-training datasets, are released. See [Sol-RL doc](https://nvlabs.github.io/Sana/docs/sol_rl/) | [Page](https://nvlabs.github.io/Sana/Sol-RL/) | [Paper](https://arxiv.org/abs/2604.06916).\n- 🔥 [2026/03] 📺 **SANA-Video 720p model with LTX-VAE** is released. Use it with LTX2 Refiner to upscale the videos to 2K resolution! See [Model Zoo](https://nvlabs.github.io/Sana/docs/model_zoo/#sana-video), [SANA-Video doc](https://nvlabs.github
FAQ (2)
문제 해결커스텀 학습된 기본 확산 모델을 Dreambooth + LoRA 미세 조정을 위해 diffusers 형식으로 변환하는 방법?
제공된 스크립트를 사용하세요: python tools/convert_sana_to_diffusers.py. 이 스크립트는 diffusers 형식이 아닌 가중치를 예상된 diffusers 상태 사전 형식으로 변환하여, 모델이 Dreambooth 및 LoRA 훈련 스크립트와 호환되도록 합니다.
문제 해결왜 LongSanaVideoPipeline이 diffusers에서 누락되었으며 LongSana를 어떻게 실행할 수 있나요?
LongSanaVideoPipeline은 아직 diffusers 라이브러리(최신 dev 버전에서도)에 구현되지 않았습니다. Hugging Face 모델 페이지에는 'coming soon'이라고 명시되어 있습니다. 임시 해결책으로 공식 Sana 저장소를 클론(git clone https://github.com/nvlabs/Sana.git)하고 추론 가이드를 따르세요. 비디오 생성이 필요하다면 이미 사용 가능한 SANA-Video 파이프라인을 시도해볼 수도 있습니다.