Skip to content
Learni
View all tutorials
Intelligence Artificielle

Comment configurer Stable Diffusion localement en 2026

Introduction

Stable Diffusion est un modèle de diffusion latent qui permet de générer des images à partir de descriptions textuelles. En 2026, le déployer localement offre un contrôle total sur la confidentialité, les coûts et les personnalisations. Ce tutoriel intermédiaire vous guide pas à pas pour configurer un environnement fonctionnel avec la bibliothèque diffusers de Hugging Face.

Prérequis

  • Python 3.10 ou supérieur
  • GPU NVIDIA avec CUDA 12+
  • 8 Go de VRAM minimum
  • Connaissances de base en ligne de commande et Python

Installation des dépendances

terminal
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install diffusers transformers accelerate safetensors

Ces commandes installent PyTorch avec support CUDA et les bibliothèques essentielles pour charger et exécuter Stable Diffusion de manière optimisée.

Script de génération basique

generate.py
import torch
from diffusers import StableDiffusionPipeline

model_id = "runwayml/stable-diffusion-v1-5"
pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
pipe = pipe.to("cuda")

prompt = "un chat astronaut sur la lune, style réaliste"
image = pipe(prompt, num_inference_steps=30, guidance_scale=7.5).images[0]
image.save("output.png")

Ce script charge le modèle Stable Diffusion v1.5 en précision float16 pour économiser la VRAM et génère une image à partir du prompt fourni.

Optimisation mémoire

generate_optimized.py
import torch
from diffusers import StableDiffusionPipeline

pipe = StableDiffusionPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5", 
    torch_dtype=torch.float16,
    use_safetensors=True
)
pipe.enable_model_cpu_offload()
pipe.enable_sequential_cpu_offload()

prompt = "paysage montagneux au coucher du soleil"
image = pipe(prompt, num_inference_steps=25).images[0]
image.save("optimized.png")

L'activation du offloading CPU permet d'exécuter le modèle sur des cartes graphiques avec moins de VRAM tout en conservant des performances acceptables.

Utilisation d'un scheduler personnalisé

custom_scheduler.py
from diffusers import StableDiffusionPipeline, DPMSolverMultistepScheduler
import torch

pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5", torch_dtype=torch.float16)
pipe.scheduler = DPMSolverMultistepScheduler.from_config(pipe.scheduler.config)
pipe = pipe.to("cuda")

prompt = "portrait de femme en style cyberpunk"
image = pipe(prompt, num_inference_steps=20).images[0]
image.save("dpm_output.png")

Remplacer le scheduler par DPMSolver permet de réduire le nombre d'étapes d'inférence tout en maintenant une qualité élevée des images générées.

Interface Gradio simple

app.py
import gradio as gr
import torch
from diffusers import StableDiffusionPipeline

pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5", torch_dtype=torch.float16).to("cuda")

def generate_image(prompt):
    image = pipe(prompt, num_inference_steps=30).images[0]
    return image

gr.Interface(fn=generate_image, inputs="text", outputs="image").launch()

Ce code crée une interface web locale avec Gradio pour tester rapidement différents prompts sans modifier le script Python à chaque fois.

Bonnes pratiques

  • Utilisez toujours torch.float16 ou torch.bfloat16 pour réduire la consommation mémoire
  • Activez les optimisations comme xformers ou torch.compile quand disponible
  • Stockez les modèles en format safetensors pour plus de sécurité
  • Testez différents schedulers pour chaque type de prompt
  • Gardez un historique des seeds pour reproduire les bons résultats

Erreurs courantes à éviter

  • Oublier d'activer CUDA et exécuter sur CPU uniquement
  • Utiliser des prompts trop longs sans négatif prompt
  • Ignorer les erreurs de VRAM insuffisante sans activer le model offload
  • Ne pas mettre à jour les dépendances diffusers régulièrement

Pour aller plus loin

Découvrez nos formations avancées sur l'IA générative pour maîtriser le fine-tuning et le contrôle avancé de Stable Diffusion.