2026年4月3日,谷歌更新了Gemini API的计费方式,推出五种服务档位:标准、弹性、优先、批量和缓存。
- 弹性档和批量档价格打五折,响应延迟分别为1–15分钟和最长24小时;
- 缓存档按缓存的Token数量和保存时长收费;
- 优先档价格上浮75%–100%,延迟控制在毫秒到秒级,适合实时客服、反欺诈等对速度要求极高的场景;
- 标准档保持原有性能与定价。
此次调整是为了让不同需求的用户更灵活地平衡响应速度与使用成本。