理解 AI（四）：Temperature 与 Top-P——AI 的创造力旋钮

1、同一个问题，不同的回答

你有没有发现，同样的问题问 AI 多次，得到的回答可能不一样？

有时候 AI 回答得很“保守”，精准但有点无聊；有时候又很“跳跃”，充满创意但可能跑题。

这不是 AI 在“随机发挥”，而是采样参数在起作用。

其中最关键的两个参数，就是 Temperature 和 Top-P。

2、从概率分布到“掷骰子”

回顾一下第一篇文章的核心：AI 的本质是在做“下一个 Token 预测”。

当 AI 要生成下一个词时，它实际上有一个概率分布——每个可能的词都有一个概率值。比如：

“今天天气” 后面：
- “不错”  →  35%
- “很好”  →  25%
- “很棒”  →  20%
- “很好”  →  10%
- 其他    →  10%

AI 不是选择概率最高的那个，而是从这个概率分布里“掷骰子”采样。

为什么要采样？因为这样可以让回答有变化，不会每次都一模一样。

3、Temperature：控制“随机性”的大小

Temperature（温度） 是一个控制随机性的参数。

它的取值范围通常是 0 到 2（有的模型可能不同）。

工作原理：

Temperature 值	效果	描述
0	几乎确定	每次都选概率最高的那个词，回答几乎固定
0.7	适中	有随机性，但不会太离谱
1.0	原始分布	按照模型原本的概率分布采样
1.5 - 2.0	高随机性	非常“跳跃”，可能出其不意

3.1 Temperature 的数学原理

Temperature 的本质是对概率分布做“重新加权”。

原始概率分布：

P = [0.35, 0.25, 0.20, 0.10, 0.10]

经过 Temperature 处理后：

T < 1：概率分布变得更“尖锐”，高概率的词更容易被选中
T > 1：概率分布变得更“平缓”，低概率的词也有机会被选中

数学上，这通过在 Softmax 之前对 logits（原始得分）做除法实现：

P_i = softmax(logit_i / T)

当 T → 0 时，所有概率都集中到最高的那个词；当 T → ∞ 时，所有词的概率趋于相等。

3.2 什么时候用高 Temperature？什么时候用低？

低 Temperature（0 - 0.3）：

需要确定性回答：写代码、做翻译、总结事实
不希望有创意发挥的场景
格式化输出（如 JSON）

高 Temperature（0.7 - 1.2）：

需要创意发挥：写故事、头脑风暴、取名字
希望回答有多样性的场景
开放性问答

4、Top-P：控制“候选范围”

Top-P（也叫做 Nucleus Sampling） 是另一个控制随机性的参数。

它的取值范围是 0 到 1（通常 0.9 左右）。

Top-P 的工作方式是：从概率最高的词开始选择，累加概率，直到达到 P 为止。

举个例子，P = 0.9：

排序后的概率分布：
- “不错”  →  35%
- “很好”  →  25%  → 累计 60%
- “很棒”  →  20%  → 累计 80%
- “很好”  →  10%  → 累计 90%  ← 超过 P，停！

最终只有 [“不错”, “很好”, “很棒”, “很好”] 这四个词会成为候选，其他概率很低的词被排除。

4.1 Top-P 的直观理解

可以把它想象成：“我只考虑那些加起来能占总数 90% 的高概率词，其他太罕见的词就不考虑了”。

Top-P 很小（如 0.1）：只选最确定的几个词，回答保守
Top-P 很大（如 0.95）：候选范围很大，可能选到一些不太确定的词

5、Temperature 和 Top-P 的关系

这两个参数经常一起使用，控制的是同一个东西——从概率分布中采样的方式。

参数	控制维度	描述
Temperature	概率分布的“形状”	控制整体随机性的大小
Top-P	候选词的数量	控制只考虑多“头部”的词

实际使用中，通常：

只调 Temperature，把 Top-P 设为 1（不做额外限制）
或者同时调两个参数
极端情况下，Temperature = 0 + Top-P = 0.1 可以获得非常确定性的输出

6、一个实际例子

假设我们要 AI 取一个项目名称：

Prompt: “帮我给一个新开发的笔记软件取个名字”

用 Temperature = 0：

“灵思笔记” 再问一次，还是“灵思笔记”

用 Temperature = 0.8：

第一次：“墨语笔记” 第二次：“轻记” 第三次：“云笺笔记”

用 Temperature = 1.5：

第一次：“量子墨水” 第二次：“记忆漂流瓶” 第三次：“思想的涟漪”

可以看到，温度越高，名字越有创意，但也越“飘”。

7、本质是什么

Temperature 和 Top-P 都是采样参数，控制的是“从概率分布中怎么选词”。

Temperature 通过重新加权概率分布，控制整体的随机程度
Top-P 通过限制候选词的数量，控制采样的“保守程度”

这两个参数让 AI 的输出从“机械固定”到“随机创作”成为可能。它们是 AI 从“搜索引擎”变成“创意伙伴”的关键。

理解了这两个参数，你就掌握了调节 AI 行为的第一把钥匙。

下一篇文章，我们会聊一个更底层的问题：Embedding——AI 怎么“理解”语义？为什么它能判断两段文字意思相近？

每天前进一小步，就是一个新的高度！