头部广告

OpenAI发现将推理成本减半的新方法

日期:2026-06-30 22:22:05 栏目:matlab 阅读:
小链网报道,据一位知晓相关讨论的知情人士透露,有一则此前从未对外披露的消息:本月早些时候,OpenAI 工程师向部分同事表示,依托几项全新研发的优化技术,他们找到了一套方案,能将模型推理成本削减一半以上。工程师将这套新技术应用于无免费 / 付费账号访客使用 ChatGPT 的场景后,一度把所需英伟达图形处理器(GPU)数量压至仅数百块 —— 这一数字低得令人震惊。目前外界尚不清楚 OpenAI 实现此番算力效率大幅提升的具体技术手段,业内常用优化方案大致包括:量化压缩、键值缓存、批量处理用户查询而非逐条单独运算,以及将部分请求分流至功耗更低的轻量化模型或模型分片进行应答。

我来作答

关于作者

2398

提问

82万+

阅读量

0

回答

0

余额

5万+

被赞

5万+

被踩