今天测试了一下 glm-4 的联网搜索 web_search
tool 调用,发现了 web_search
的网页检索返回结果中几个比较诡异的事情,特此记录:
- 有些检索结果没有
icon
、link
、media
字段,但从内容上看确实是联网搜索出来的结果,不知道其来源是啥。 - 对于有
link
的检索结果,其content
字段的值(即网页内容)是经过改写的(比如有些句子跟原网页中意思一样但内容变了),所以推测其对网页原始解析结果做了后处理,而且可能是生成式的后处理,但考虑到极快的响应速度又不太像,不知道其背后针对是啥处理逻辑。
执行代码:
import json
from openai import OpenAI
client = OpenAI(
api_key="YOUR.API_KEY",
base_url="https://open.bigmodel.cn/api/paas/v4/"
)
tools = [{
"type": "web_search",
"web_search": {
"enable": True, # 禁用:False,启用:True,默认为 True。
"search_result": True # 禁用:False,启用:True,默认为禁用
}
}]
completion = client.chat.completions.create(
model="glm-4",
messages=[
{
"role": "system", "content": "You are a helpful assistant.\n\nCurrent Date: 2024-07-11"},
{
"role": "user", "content": "最近3个月北京有哪些演唱会?"}
],
top_p=0.7,
temperature=0.3,
tools=tools
)
print(completion.