模型和计费
余额和扣费
用通俗方式说明余额、预占、实际扣费、消费记录和失败请求。
余额不会凭空变化
每一次最终余额变化都应该能在余额流水里找到原因。遇到疑问时,先看消费记录、余额流水和 request_id。
一次调用怎么扣费
余额不会凭空变化:一次调用通常会经历可用余额检查、预占、实际扣费或待人工复核;最终余额变化应能对应到消费记录和余额流水。
Prop
Type
哪些请求会扣费
- 成功完成并拿到 usage 的模型调用,会按模型价格扣费。
- 零 usage 或零费用的成功调用,也会留下 0 金额消费记录,方便审计。
- 认证失败、余额不足、没有可用模型这类本地前置失败,通常不会扣模型费用。
/v1/messages/count_tokens只做校验和转发,不计费。
为什么余额会先被占住
有些请求在发送给上游前,系统还不知道最终会输出多少内容。为了保护账号余额,顶级AI会先按请求估算预占一部分余额,等请求结束后再按真实用量结算或释放。
排查账务问题时提供什么
- 调用时间。
- 模型名。
- 调用日志里的
request_id。 - 充值订单号或余额流水截图。