文章背景:
某公司请了另外的企业在其服务器部署了一套满血版的deepseek,并向外提供了一个调用API,具体使用文档参考首次调用 API | DeepSeek API Docs,与官网一样(部署方式不明,只知道调用方法和官网相同),在此基础上,公司希望实现联网搜索的功能,对标市面上热门的AI平台。
实现逻辑:
用户登录平台后提出问题,在回答问题之前,判断如果客户开启了联网搜索的功能,则调用联网搜索引擎的API,获取复数的结果集,再将此结果集(网页)的简介,标题,链接地址整合成一个content,丢进AI对话的message里,AI就能整合搜索结果进行逻辑推理,回答问题。
实现步骤:
1. 登录Google Search API for real-time SERP scraping 注册并获取密钥(我尝试过搜狗、Bing等其他搜索引擎,要么是注册条件太苛刻要么是需要翻墙,searchAPI是最方便的)。
2.拿到key之后,在前端或者后端调用API,前端格式如下(推荐后端调用,否则容易造成泄露)
3.等待引擎返回response,一般需要数秒到十几秒不等(对于本地部署的企业来说,体验感相差很多),然后是对结果做格式化
4.丢进AI对话消息记录的content里,AI就会根据搜索结果作答
缺点:
1. 不具有强时效性,如差现在时间或者当天天气,结果是昨天的(豆包与deepseek官网亦是如此)
2.开启联网搜索之后,思维链和推理结果都是围绕搜索返回结果输出,与用户问题本质性有偏颇
3.是否开启联网搜索完全由用户决定,无法根据问题的推理逻辑确定是否联网
4.联网搜索的结果无法把控,质量不一
5.检索结果的网页有效信息仅局限在网页的简介,无法检索获取里面的内容
6.联网搜索时间需要数秒到十几秒,与原来的秒答体验差距大
针对第五点,豆包以及其他热门AI平台是能够主动检索链接的内容,但我还没找到实现方式,有经验的小伙伴可以交流一下