D

Diffusion Models

Denoising Diffusion Probabilistic Models (DDPM) 2020

Forward process(q)

Reverse process(pθ)

为什么可以只预测噪声 ε

Loss 简化成 MSE 的推导

“训练就是学一个去噪器”

Denoising Diffusion Implicit Models (DDIM) 2021

为什么可以少步数采样

deterministic vs stochastic

sampling 和 training 分离

“扩散慢 ≠ 本质慢”

Score-Based Generative Modeling through SDEs

score = ∇x log p(x)

diffusion ≈ score matching

SDE / ODE 统一

Diffusion = 学数据分布的梯度场

Classifier-Free Diffusion Guidance (2021)

Stage 3:条件生成 & 文生图

目标:搞懂为什么 diffusion 能文生图

重点读:

  • 为什么不用 classifier 也能 guidance
  • guidance scale 在干嘛
  • trade-off:fidelity vs diversity

👉 Stable Diffusion 的“灵魂”

High-Resolution Image Synthesis with Latent Diffusion Models (LDM)

重点读:

  • 为什么在 latent space diffusion
  • Autoencoder + Diffusion 的分工
  • 显存和算力优势

Scalable Diffusion Models with Transformers (DiT)

重点读:

  • Transformer 替代 U-Net
  • scale law + diffusion