User Guide
稳定性与容错
在高强度创作下保持调用稳定(进阶)
稳定性与容错
稳定性配置的核心目标是:
- 少失败
- 失败后可恢复
- 出错时可定位
三个关键参数
重试
用于处理偶发失败。
建议:
- 最大重试次数:2 到 3 次
- 首次重试延迟:1 秒左右
- 使用递增退避,避免短时间反复打满请求
超时
用于避免单次请求长时间卡住。
建议:
- 普通文本任务:较短超时
- 长文或复杂任务:适当放宽
- 图片任务:通常需要更长超时
故障回退
主连接失败后自动走备用连接,减少中断。
推荐调参顺序
- 先调超时
- 再调重试
- 最后配置回退策略
诊断建议
连续失败
优先检查:
- 连接状态是否可用
- 当前模型是否可调用
- 是否触发限流
偶发失败
通常先提高重试效果更明显。
高峰波动
建议拆分任务批次,避免同一时刻大量并发。