砍掉90%冗余词元，省下70万美元：Netflix开源工具狙击AI账单黑洞

IInfoQ 中文 AI2026年6月19日 01:42约 2 分钟阅读↗ 查看原文

主要内容

大模型API按token计费，输出冗余词元（如重复解释、格式填充）导致成本虚高。Netflix开发Maestro，在推理阶段过滤冗余内容，保留语义完整性。

对于大量调用GPT、Claude等API的开发者，Maestro能直接降低每月账单。开源后更可定制接入，是解决AI成本瓶颈的实用方案。

🇨🇳

对中国用户与市场

国内开发者可借鉴其思路，在调用国产大模型API时也可类似优化，减少token消耗，尤其对预算有限的中小团队友好。

⚠尚未确定的部分

→可采取的行动

#Netflix#Maestro#开源工具#成本优化#词元压缩#AI推理

🤖 本文根据 InfoQ 中文 AI 的 RSS 内容整理，并由 AI 辅助提炼要点。完整上下文请以原文为准。