Diffusers
D
Diffusion Models
Denoising Diffusion Probabilistic Models (DDPM) 2020
Forward process(q)
Reverse process(pθ)
为什么可以只预测噪声 ε
Loss 简化成 MSE 的推导
“训练就是学一个去噪器”
Denoising Diffusion Implicit Models (DDIM) 2021
为什么可以少步数采样
deterministic vs stochastic
sampling 和 training 分离
“扩散慢 ≠ 本质慢”
Score-Based Generative Modeling through SDEs
score = ∇x log p(x)
diffusion ≈ score matching
SDE / ODE 统一
Diffusion = 学数据分布的梯度场
Classifier-Free Diffusion Guidance (2021)
Stage 3:条件生成 & 文生图
目标:搞懂为什么 diffusion 能文生图
重点读:
- 为什么不用 classifier 也能 guidance
- guidance scale 在干嘛
- trade-off:fidelity vs diversity
👉 Stable Diffusion 的“灵魂”
High-Resolution Image Synthesis with Latent Diffusion Models (LDM)
重点读:
- 为什么在 latent space diffusion
- Autoencoder + Diffusion 的分工
- 显存和算力优势
Scalable Diffusion Models with Transformers (DiT)
重点读:
- Transformer 替代 U-Net
- scale law + diffusion
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.
