Context Window
上下文窗口(Context Window)是模型在单次交互中一次能看到的词元总数。
上下文窗口包含什么
所有必须放进窗口的东西:
- System Instructions(系统指令)
- Conversation History(对话历史)
- Retrieved Knowledge(外部注入的文档或数据)
- Tool Descriptions(工具描述)
- Tool Outputs(工具调用结果)
- User Input(用户的实际问题)
现代模型规模
现代模型宣称的上下文窗口从 128,000 到超过 200 万词元不等。但越大不直接等于更好。
有效上下文长度
营销窗口 ≠ 有效窗口。
- 模型能通过百万级词元的 “大海捞针” 测试(在长文档中找一个预设句子)
- 但可靠地综合数百页散落的信息是完全不同的能力
- 实际能有效利用的上下文长度通常比宣称值小得多
参见 Attention Mechanism(注意力不均)和 Context Rot(性能断崖式下降)。