User Guide
模型分发规则
按任务类型将请求分发到不同模型(进阶)
模型分发规则
分发规则用于把不同任务自动交给更合适的模型。
什么时候需要它
- 文本创作和图片任务使用不同模型
- 同一主题需要“快速草稿 + 高质量润色”两种路径
- 你希望把高成本任务限制在特定模型上
常见策略
按任务类型分发
- 长文写作走高质量模型
- 快速问答走低延迟模型
- 图片任务走图片专用模型
按阶段分发
- 初稿阶段:速度优先
- 定稿阶段:质量优先
按兜底分发
主模型异常时,自动回退到备用模型。
示例(示意)
routes:
- pattern: "video-script-*"
provider: "primary"
model: "high-quality-model"
priority: 10
- pattern: "quick-*"
provider: "fast-lane"
model: "fast-model"
priority: 20
- pattern: "*"
provider: "fallback"
priority: 100
配置建议
- 先只配 2 到 3 条关键规则
- 给兜底规则留最后优先级
- 每次改完都做一次路由测试
常见误区
- 规则过多导致难以维护
- 没有兜底规则,异常时直接失败
- 频繁改规则但不做回归测试