在过去的一年里,人工智能技术成为主流是一个至关重要的发展。在OpenAI的ChatGPT迅速崛起的过程中,许多行业都将这些生成性人工智能算法作为有用的工具。然而,这些工具中的许多都具有相当陡峭的学习曲线。在本指南中,我们将揭示什么是稳定扩散中的CFG尺度。

事实上,稳定扩散已经成为行业中最受欢迎的图像生成工具之一。该算法令人印象深刻的输出使其成为当今可用的图像生成程序之一。然而,它仍然保留着大量的方面,需要一些时间才能掌握。

当使用“稳定扩散”时,有很多事情可以极大地改善或阻碍结果。随后,了解它们是什么,以及如何使用它们来改进特定用例的算法,这一点很重要。现在,本指南将探讨什么是CFG量表,以及为什么它如此重要。

什么是CFG量表?

另请阅读:在稳定的扩散提示中需要逗号吗?

现在,在我们进入该程序的效果之前,让我们来探究一下CFG量表是什么。在稳定扩散中,这三个字母表示无分类器引导量表。具体来说,这表示一个设置,该设置表示生成图像时“稳定扩散”与文本提示的紧密程度。

该比例应用于算法的文本到图像(txt2img)和图像到图像(img2img)生成。此外,CFGH值越高,算法就越严格地遵守输入的文本提示。

或者,该值越低,系统在生成图像时就越自由。CFG比例的默认值为7,这是一个很好的起点,并在系统自由度和对给定方向的服从性方面表现出一定的平衡。

系统WebUI将只允许正数,1是可能的最低值。此外,它将允许最大输入30。这些数字为规模提供了很好的保护,尽管程序的不同迭代可能会出现例外。

它如何影响稳定扩散

另请阅读:如何训练稳定扩散?

既然我们知道了CFG尺度是什么,让我们来探究它是如何影响稳定扩散的。尽管刻度本身会决定系统遵循文本说明的程度,但它并没有那么简单。输入的CFG值会有不同的副作用,像Euler A采样方法这样的方法会显示出这些差异。

具体而言,在Once Upon An Algorithm的示例中,增加CFG会导致颜色饱和度增加。此外,它会导致对比度的增加和图像的模糊,从而产生远没有那么详细的工作。

如果你对这些事情有意见,平衡图像生成是很重要的。具体来说,您可以做一些事情,比如增加采样器步骤或更改采样器方法。然而,重要的是要记住不断测试CFG量表的效果。最终,试错是获得所需输出的最佳结果的最佳方式。

微信里点“发现”,扫一下二维码便可将本篇文章分享至朋友圈