CANN Recipes
文档
场景库
代码示例
快速开始
进入文档
场景库
推理
低时延高吞吐的端到端优化
模型量化推理
高吞吐服务
关键指标:平均延迟 2.6ms
长序列语义理解
批量分析
关键指标:吞吐提升 2.1x
示例入口
典型代码示例
GPT-OSS推理优化
适配多批次、多精度推理流水线
打开示例
场景文档
对应场景的完整 Recipe 集合
阅读场景文档