问题描述 使用百炼平台调用qwen2.5-72b-instruct模型,流式输出和非流式都有用到。 现有需求需要获取非流式调用过程中,输入和输出token数量,但是没有在接口中看到,于是去官方的试验台测试,发现是可以看到usage_token的。 过程 询问客服得知部分模型不支持获取token使用信息 其实在官方文档里也写了有这个数据但是。。。 结论 最后还是选择使用tiktoken去自己计算token使用数