Google Lens是一个免费工具,允许您分析图像以提取文本等数据并识别物体、人物、动物、植物等。您还可以使用它来搜索与提供的图像相似的视觉匹配项。
这个强大的工具对于消费者和企业都非常宝贵,它可以提供有关产品供应情况、价格和评论的见解。但是,手动从Google Lens提取数据可能非常耗时且效率低下。
本指南将引导您完成使用Scrapeless Google Lens API抓取Google Lens产品结果的过程,为您提供有效自动化此任务的工具和技术。
继续滚动!
了解Google Lens产品搜索
Google Lens使用先进的图像识别技术来识别图像中的产品。识别产品后,Google Lens会显示相关结果列表,包括产品名称、价格、零售商和评论。这些数据对于市场研究、价格比较和竞争对手分析至关重要。
然而,Google Lens的动态特性及其潜在的反抓取措施使得自动化数据提取极具挑战性。
抓取Google Lens的挑战
- 动态内容: Google Lens依赖JavaScript动态加载数据。使用Selenium或Puppeteer等工具确保您的抓取器在提取信息之前等待所有元素加载完毕。
- 反抓取措施: 通过轮换用户代理和使用代理将请求分散到多个IP地址来避免被检测。
- 速率限制: 以受控的速度发送请求以避免IP被封禁。在请求之间引入延迟以模拟人类行为。
为什么我们应该使用API?
您可能希望使用API,特别是Scrapeless Google Lens API,原因如下:
- 无需从头创建并维护解析器。
- 绕过Google的封锁:解决验证码或IP封锁问题。
- 无需付费购买代理和验证码求解器。
- 无需使用浏览器自动化。
Scrapeless API在后端处理所有事务,响应时间非常快,每个请求不到~3.3秒,并且无需浏览器自动化,因此速度会快得多。
如何抓取Google Lens产品结果?
您的第一反应可能是尝试使用编程来实现抓取任务。但是,由于时间和精力限制🚫。大多数聪明的用户选择使用廉价且快速的API来完成复杂的数据提取。它可以通过简单的配置完成:
预备条件
首先,让我们建立与Google Lens API的连接并使用google_lens
源。您可以按照我们文档中提供的说明操作。
步骤1:创建您的Google Lens API令牌
要开始,您需要从Scrapeless Dashboard获取您的API密钥:
- 登录到Scrapeless Dashboard。
- 导航到API密钥管理。
- 点击创建以生成您的唯一API密钥。
- 创建后,只需点击API密钥即可复制它。
步骤2:编写Python脚本以集成Scrapeless API
import json
import requests
class Payload:
def __init__(self, actor, input_data):
self.actor = actor
self.input = input_data
def send_request():
host = "api.scrapeless.com"
url = f"https://{host}/api/v1/scraper/request"
token = "your_token"
headers = {
"x-api-token": token
}
input_data = {
"engine": "google_lens",
"hl": "en",
"country": "us",
"search_type": "products",
"url": "https://m.media-amazon.com/images/I/61iBtxCUabL._AC_UF894,1000_QL80_.jpg",
}
payload = Payload("scraper.google.lens", input_data)
json_payload = json.dumps(payload.__dict__)
response = requests.post(url, headers=headers, data=json_payload)
if response.status_code != 200:
print("Error:", response.status_code, response.text)
return
print("body", response.text)
if __name__ == "__main__":
send_request()
替代方法:使用Playground
您也可以选择使用Scrapeless Playground来完成Google Lens产品的资料提取。
- 创建API令牌后,点击Deep SerpApi
- 找到Google Lens执行器
- 添加您需要完成请求配置的参数。
- 点击开始搜索并等待结果加载。
- 导出结果
步骤3. 获取抓取结果
以下是部分抓取结果,仅供演示参考:
{
"search_metadata": {
"status": "success",
"created_at": "2025-03-18 09:11:05 UTC",
"processed_at": "2025-03-18 09:11:05 UTC",
"google_lens_url": "https://lens.google.com/uploadbyurl?hl=en-sg&url=https%3A%2F%2Fm.media-amazon.com%2Fimages%2FI%2F61iBtxCUabL._AC_UF894%2C1000_QL80_.jpg",
"total_time_taken": 6.667
},
"search_parameters": {
"engine": "google_lens",
"url": "https://m.media-amazon.com/images/I/61iBtxCUabL._AC_UF894,1000_QL80_.jpg",
"search_type": "products"
},
"visual_matches": [
{
"position": 1,
"title": "Apple Airpods 4 : Target",
"link": "https://www.target.com/p/ap2022-true-wireless-bluetooth-headphones/-/A-85978615",
"currency": "USD",
"price": "$130*",
"extracted_price": 130,
"stock_information": "In stock",
"source": "Target",
...
从Google Lens抓取数据是否合法?
抓取Google Lens数据并不违法,但需要遵守各种法律和道德准则。用户必须了解Google的服务条款、数据隐私法和知识产权,以确保其活动符合规定。通过遵循最佳实践并随时了解法律发展动态,您可以最大限度地降低与网络抓取相关的法律问题的风险。
Scrapeless Deep SerpAPI:强大的实时搜索数据解决方案
Deep SerpApi是一个实时搜索数据平台,专为AI应用和检索增强生成(RAG)模型而设计,提供实时、准确和结构化的Google搜索结果数据,支持超过20种Google SERP类型,包括Google搜索、Google趋势、Google购物、Google航班、Google酒店、Google地图等。
Deep SerpApi的优势有哪些?
- 实时数据更新: 基于过去24小时内的数据更新,确保信息的及时性和准确性。
- 多语言和地理位置支持: 支持多种语言和地理位置,可以根据用户的地理位置、设备类型和语言定制搜索结果。
- 1-2秒响应: 平均响应时间仅为1-2秒,适合高频次和大规模数据检索。
- 无缝集成: 与Python、Node.js、Golang等主流编程语言兼容,可以轻松集成到现有项目中。
- 高性价比: 价格低至每1000次查询0.1美元,是市场上最具成本效益的SERP解决方案。
立即获得您的奖励!
赞助开发者计划正在进行中!前100位用户将获得50万次免费API调用,非常适合测试和扩展项目。
您可以将Deep SerpApi集成到您的AI工具、应用程序或您正在处理的任何项目中。我们支持Dify等框架(Langchain、Langflow、FlowiseAI以及许多其他框架即将推出!)。您还可以通过适合您项目的其他方式集成Scrapeless。
集成完成后,请通过GitHub或社交媒体与我们分享您的作品,并提供集成证明。作为回报,我们将为您提供为期1个月的50万次免费查询,以帮助您最大限度地利用我们产品的优势。
底线
本教程介绍了如何使用Scrapeless的Google Lens API来抓取结果。按照我们的步骤,您可以轻松使用Scrapeless API来设置环境,提取相关数据,并将其保存到文件中以便轻松访问。
此外,Deep SerpApi Playground节省了我们许多不必要的复杂步骤。您只需进行简单的参数配置即可获得准确的数据结果。