我通常使用 GPT 的方式是,先用 GPT-4 来快速搭建一个原型,然后不断优化,直到解决方案能够在 GPT-3.5 模型上运行。
这个方法在我的实践中非常高效,它的一个重要好处是能迅速筛选出那些“行不通”的项目——如果你在几天内都无法使项目在 GPT-4 的基础上运行起来,那么这个项目可能就不值得进一步深入。
实际上,这就是我在 2023 年全年向合作公司推荐的工作流程。GPT-4 有一些问题,使得将其应用于实际生产环境并不理想。
我对 GPT-4 的具体担忧包括:
- 直到几个月前,OpenAI 本身还表示 GPT-4 尚未准备好投入生产使用。他们的官方建议是将其用于原型设计阶段。
- 长期以来,GPT-4 的请求速率限制非常严格。以前,它的上限仅为每分钟 200 个请求,而现在已经提升至每分钟 10,000 个。
- GPT-4 一直比 GPT-3.5 慢。我在 6 月对模型进行的基准测试显示,GPT-4 相比 GPT-3.5 的令牌间延迟高出 3 倍。
- 在历史上,GPT-4 的成本远高于 GPT-3.5。例如,2023 年 3 月,对于一个平均应用来说,GPT-3.5 的成本仅为 GPT-4 的五分之一。
自 2023 年 3 月起,这些因素都发生了显著的变化。请求速率限制、性能和定价都有了大幅提升,主流的 GPT-4 模型现已非常适用于生产环境——尽管 GPT-4 Turbo 还未达到这一水平。
GPT 价格历史
回顾一下,GPT 模型的成本如何随时间变化:
模型 | 每千个输入 Token 的价格 | 每千个输出 Token 的价格 |
---|---|---|
gpt-4-1106-preview |
0.0100 美元 | 0.0300 美元 |
gpt-4-0613 |
0.0300 美元 | 0.0600 美元 |
gpt-4-0314 |
0.0300 美元 | 0.0600 美元 |
gpt-3.5-turbo-1106 |
0.0010 美元 | 0.0020 美元 |
gpt-3.5-turbo-16k-0613 |
0.0030 美元 | 0.0040 美元 |
gpt-3.5-turbo-0613 |
0.0015 美元 | 0.0020 美元 |
gpt-3.5-turbo-0301 |
0.0020 美元 | 0.0020 美元 |