AI 大模型的 Temperature 参数是用来控制模型生成输出时的随机性和创造性的一个关键指标。具体来说,它调整的是生成结果的概率分布平滑度。

工作原理

  • 模型生成文本时,每个可能的词都有一个预测概率(由软最大值归一化生成)。
  • Temperature 参数用于控制这个概率分布的尖锐程度或平滑程度:
    • 低 Temperature(趋近 0):
      • 让分布更尖锐,模型会倾向于选择概率最高的词。
      • 结果更加确定性,输出更保守。
    • 高 Temperature(>1):
      • 让分布更平滑,模型有更高的几率选择低概率的词。
      • 结果更加随机,输出更具创造性。

数学上,Temperature 会作用在预测概率上:

其中 T 是 Temperature 参数。

  • 当 𝑇 → 0:会使最高概率的词占主导,结果变得更确定。

以下是关于其他AI大模型文档中关于各种请求参数的介绍