稳定扩散中的CFG尺度是多少？ - 币界网 - 区块链加密货币研究中心

在过去的一年里，人工智能技术成为主流是一个至关重要的发展。在OpenAI的ChatGPT迅速崛起的过程中，许多行业都将这些生成性人工智能算法作为有用的工具。然而，这些工具中的许多都具有相当陡峭的学习曲线。在本指南中，我们将揭示什么是稳定扩散中的CFG尺度。

事实上，稳定扩散已经成为行业中最受欢迎的图像生成工具之一。该算法令人印象深刻的输出使其成为当今可用的图像生成程序之一。然而，它仍然保留着大量的方面，需要一些时间才能掌握。

当使用“稳定扩散”时，有很多事情可以极大地改善或阻碍结果。随后，了解它们是什么，以及如何使用它们来改进特定用例的算法，这一点很重要。现在，本指南将探讨什么是CFG量表，以及为什么它如此重要。

什么是CFG量表？

另请阅读：在稳定的扩散提示中需要逗号吗？

现在，在我们进入该程序的效果之前，让我们来探究一下CFG量表是什么。在稳定扩散中，这三个字母表示无分类器引导量表。具体来说，这表示一个设置，该设置表示生成图像时“稳定扩散”与文本提示的紧密程度。

该比例应用于算法的文本到图像（txt2img）和图像到图像（img2img）生成。此外，CFGH值越高，算法就越严格地遵守输入的文本提示。

或者，该值越低，系统在生成图像时就越自由。CFG比例的默认值为7，这是一个很好的起点，并在系统自由度和对给定方向的服从性方面表现出一定的平衡。

系统WebUI将只允许正数，1是可能的最低值。此外，它将允许最大输入30。这些数字为规模提供了很好的保护，尽管程序的不同迭代可能会出现例外。

另请阅读：如何训练稳定扩散？

既然我们知道了CFG尺度是什么，让我们来探究它是如何影响稳定扩散的。尽管刻度本身会决定系统遵循文本说明的程度，但它并没有那么简单。输入的CFG值会有不同的副作用，像Euler A采样方法这样的方法会显示出这些差异。

具体而言，在Once Upon An Algorithm的示例中，增加CFG会导致颜色饱和度增加。此外，它会导致对比度的增加和图像的模糊，从而产生远没有那么详细的工作。

如果你对这些事情有意见，平衡图像生成是很重要的。具体来说，您可以做一些事情，比如增加采样器步骤或更改采样器方法。然而，重要的是要记住不断测试CFG量表的效果。最终，试错是获得所需输出的最佳结果的最佳方式。

微信里点“发现”，扫一下二维码便可将本篇文章分享至朋友圈