OpenAI 公布新型 AI 文生图方案“sCM”,号称效率是传统扩散模型 50 倍
news2024-10-27 16:0011540
IT之家 10 月 27 日消息,OpenAI 本周公布了一款名为 sCM(Continuous-Time Consistency Model)的新型 AI 文生图方案。与传统的扩散模型相比,sCM 仅需两个步骤即可生成高质量样本,可显著提高文生图的生成效率,并且生成的样本质量可与业内领先的扩散模型相媲美,为 AI 文生图提供了新的解决方案。当前,一般采用扩...
IT之家 10 月 27 日消息,OpenAI 本周公布了一款名为 sCM(Continuous-Time Consistency Model)的新型 AI 文生图方案。
与传统的扩散模型相比,sCM 仅需两个步骤即可生成高质量样本,可显著提高文生图的生成效率,并且生成的样本质量可与业内领先的扩散模型相媲美,为 AI 文生图提供了新的解决方案。
当前,一般采用扩散模型生成图片和音视频,但传统的扩散模型在取样过程中通常速度较慢,需要执行数十甚至数百个逐步降噪的过程才能生成高质量的样本(例如,使用 SD“炼丹”绘图的用户需要等待漫长的降噪时间),这导致模型的效率低下,不适合商业化应用。
尽管目前已经出现了一些技术用于加快扩散模型的速度,但主要是通过复杂的训练过程“提纯”模型,或牺牲输出样本质量以提高效率。
然而, OpenAI 研究团队提出了一种名为 sCM 的文生图方案,该生成模型方法不同于传统扩散模型,声称只需两个取样步骤即可生成与扩散模型一致质量的高分辨率样本,大幅缩短了生成时间。
据 IT之家 报道,sCM 的训练方法主要利用经过预训练的扩散模型知识来构建模型,声称能够在缩短取样时间的同时保持高质量样本生成。
研究人员采用 ImageNet 512x512 数据集,使用 sCM 方法训练模型,声称可以生成细节丰富且高质量的图像,展示其在高分辨率生成方面的能力。尽管 sCM 只经过两个取样步骤,生成样本的质量仍接近业内“最佳的扩散模型”,声称“差异不到 10%”。
广告声明:文内包含对外跳转链接(例如超链接、二维码、口令等),意在传递更多信息,减少筛选时间,结果仅供参考。
相关文章