What is the request-per-minute rate limit for Azure openAI models for gpt-3.5-turbo?

题意:“Azure OpenAI 模型中的 GPT-3.5-Turbo 每分钟的请求限制是多少?”

问题背景:

I couldn't find the RPM limit for Azure openAI

“我找不到 Azure OpenAI 的每分钟请求限制。”

I found the TPM limit thou which is 240k for East US, South Central US, West Europe, France Central, UK South,

“不过我找到了每分钟请求数的限制,即东美、美国南中部、西欧、法国中部和英国南部的限制是 240k。”

I've tried Microsoft documentation but couldn't find this limit. Azure OpenAI Service quotas and limits - Azure AI services | Microsoft Learn

“我查阅了微软文档,但没能找到这个限制。Azure OpenAI 服务配额和限制 - Azure AI 服务 | Microsoft Learn”

问题解决:

The "RPM" (request per minute) quota is directly a rate of the "TPM" (transaction per minute):

“‘RPM’(每分钟请求数)配额直接是‘TPM’(每分钟事务数)的速率。”

So for GPT 3.5 Turbo models, if you have a 240k TPM for your deployment, the RPM will be 1440 requests per minute.

“因此,对于 GPT-3.5 Turbo 模型,如果您的部署有 240k TPM,那么 RPM 将是每分钟 1440 次请求。”

Example visible in Azure AI Studio: in my case, I set a 120k TPM, I got 720 RPM:

“在 Azure AI Studio 中可以看到的示例:以我的情况为例,我设置了 120k TPM,得到了 720 RPM。”

Source: Manage Azure OpenAI Service quota - Azure AI services | Microsoft Learn

  • 8
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

营赢盈英

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值