CANN Recipes
场景库

推理

低时延高吞吐的端到端优化

模型量化推理

高吞吐服务

关键指标:平均延迟 2.6ms

长序列语义理解

批量分析

关键指标:吞吐提升 2.1x

示例入口

典型代码示例

GPT-OSS推理优化

适配多批次、多精度推理流水线

场景文档

对应场景的完整 Recipe 集合