自OpenAI公司的ChatGPT横空出世以来,大语言模型可谓风头无量。个人用户可以直接使用ChatGPT这样的会话式交互平台来辅助自己的日常工作,提高生产效率。除此之外,如果要做进一步的开发,就需要使用OpenAI提供的API。OpenAI 的 API 可用于几乎所有需要理解自然语言的任务。而且,使用API还可以大批量地自动产生输出本文。
An embedding is a vector (list) of floating point numbers. 两个向量之间的距离展现了它们之间的相关性. Small distances suggest high relatedness and large distances suggest low relatedness.
在自然语言处理中,嵌入向量(Embedding)是由一系列数字组成的序列,它是自然语言等内容的抽象表达。Embedding使机器学习模型和其他算法能够运用于文本之上,并高效地执行诸如聚类或检索等任务。
OpenAI引入了两个新的文本嵌入模型:a smaller and highly efficient text-embedding-3-small
model, and a larger and more powerful text-embedding-3-large
model。注意这两个模型的