
机器核心报告的编辑:在这段时间里,陈平,伟大的上帝彼此提出了新的研究。现在,在5月19日,他发布了另一项新作品!团队 - 集合来自CMU和MIT。纸张标题:一步生成建模纸张地址的平均流量:https://arxiv.org/pdf/2505.13447v1本文提出了一个称为seanflow的单步生成框架。它通过引入平均速度的概念来改善现有的匹配流量方法,并且比Imagenet 256×256数据集中的单步扩散/流模型的结果明显好得多,而FID得分为3.43,不需要预训练,蒸馏或课程研究。生成模型旨在将先验分布转换为数据分布。匹配流提供了一个简单的理解和简单轮廓的概念,用于构建将一个分布转移到另一个分布的流动路径。匹配流与D密切相关iffusion模型,但它专注于指导模型训练的速度场。由于引入其引入,流匹配被广泛用于现代编队模型中。本文提出了一个理论框架,称为“平均流量”,用于实施单步生成活动。主要思想是引入一个新的基地真实场来表示平均速度,而不是匹配流中常用的立即速度。文章建议使用平均速度(在时间时删除的比率),而不是标准键入Modelflow匹配的即时速度。然后,本文减少了平均速度和立即速度之间的自然触摸,这是网络培训指导原理的基础。基于这个基本概念,该论文在神经网络中训练,以指导平均速度场,并引入失去损失以奖励网络以满足平均速度与T之间的内在关系他立即速度。本文进一步表明,该图自然可以包括无分类器启动(CFG),而在采样时无需额外的费用。平均流量显示单步生成的强劲性能。在Imagenet 256×256数据集中,仅使用1-NFE(功能测试数)实现了3.43的FID标记。该结果的先前类似方法比最重要的水平要好得多,而亲戚的性能从50%到70%(见图1)。此外,平均流是一种自我发展的模型:从一开始就完全训练它,而没有任何预训练,知识扩张或课程研究。这项研究将显着缩小单步扩散/模型流量与多步研究之间的差异。过程过程的主要思想是引入一个代表平均速度的新字段。 U的平均速度可以表示为:u表示平均速度,V表示立即的速度。 u(z_t,r,t)是一个字段dep同时在(r,t)上结束。 U的字段如图3所示:U的平均速度是即时V速度的函数,即它是AV诱导的场,不取决于任何神经网络。另外,要获得适合培训的公式,本文重新编写了方程。 (3)例如:双方都来自t,考虑到独立于t的变量,并获得:左侧的手术采用了产品规则,右侧的操作加强了微积分。重新调整术语并获得身份:该方程称为平均流识别,它描述了V与U之间的关系。单步抽样实验的有效性?该实验是在256×256 Imagenet数据集上进行的。在图1中,本文与以前的单步扩散/流模型的平均流相比,如表2(左)所示。在内部,平均流量性能比其同龄人优越:它的FID为3.43,相对50%与单一逐步IMM相比,排卵的结果为7.77。如果仅比较1-NFE的一代(而不是仅一步),那么与以前的最佳方法相比,平均流量的提高了近70%(10.60)。并不难看到此过程会大大缩小单个步骤和多步扩散/流模型之间的差距。在2-nfe的一代中,平均流量实现2.20的FID(表2的左下方)。该结果与多步扩散/流模型的顶部基线模型,即DIT(FID 2.27)和SIT(FID 2.15),均为NFE 250×2(右表2)。该结果表明,模型爆炸/流程中的几个步骤与多步骤相当。值得注意的是,本文中的程序是独立的,并且从一开始就进行了全面培训。它不需要任何预训练,蒸馏或课程研究,并且取得了良好的结果。表3报道了无体的产生结果与CIFAR-10(32×32)相比,与先前的程序相比,该方法具有竞争力。表1是消融实验的结果:最后,显示了一些1-NFE的结果。有关更多详细信息,请参阅原始论文。