DDPM 数学推导
变分下界 (ELBO):将最大化对数似然转化为最小化变分下界,明确我们的目标是匹配逆向分布。 后验分布 $q(x_{t-1} \mid x_t, x_0)$:推导扩散过程逆向步骤的“真值”,为模型提供学习的靶子。 损失函数:结合前两步,将复杂的分布匹配转化为简单的噪声预测 (MSE)。
变分下界 (ELBO):将最大化对数似然转化为最小化变分下界,明确我们的目标是匹配逆向分布。 后验分布 $q(x_{t-1} \mid x_t, x_0)$:推导扩散过程逆向步骤的“真值”,为模型提供学习的靶子。 损失函数:结合前两步,将复杂的分布匹配转化为简单的噪声预测 (MSE)。
这是一篇把 DDPM(离散扩散)与 Score-based(连续 SDE / DSM)贯穿起来的文章。目标是:推导清楚,并且讲明白为什么要这样做。全文仅包含数学与解释,不含程序代码与样例实现。
2024 2024,对我来说,真的是一段痛苦且难以承受的旅程。 这一年,我和一个很好的朋友闹掰了,很多人离开了我,我也离开了很多人。 我曾以为我杀死了他,那个内在的我,可其实并没有。 他只是被关了起来,后来他挣脱了,我再也找不到他了。 是我没有保护好他。 希望他不要恨我,因为那时的我,也只是独自一人在迷雾中徘徊。...
在计算机视觉任务中,U-Net是一个经典的卷积神经网络架构,广泛应用于图像分割、医学影像分析等领域。传统的U-Net架构包含编码器(下采样路径)和解码器(上采样路径),通过下采样提取特征并通过上采样还原图像。然而,随着任务复杂性的增加和计算资源的优化需求,研究人员逐渐发现下采样和上采样运算符并不总是必要的。本文将...
1. Sigmoid