快速路示例
规则匹配,毫秒级响应
标准路示例
快速模型,<1s响应
慢速路示例
复杂问题,深度处理
对话窗口
点击"开始通话"开始演示
或直接点击左侧示例问题
响应统计
0
总查询数
<1ms
平均延迟
快速路
0 (0%)
标准路
0 (0%)
慢速路
0 (0%)
三级响应架构
Level 1: 快速路
规则匹配,不调用 LLM,毫秒级响应
Level 2: 标准路
快速模型 + Few-shot 蒸馏,<1s 响应
Level 3: 慢速路
过渡话术 + 深度思考,复杂场景专用
优化成果
优化前平均延迟3-4s
优化后平均延迟<1s
简单问题延迟<10ms