如何抓取 Google Lens 的产品搜索结果?

Google Lens是一个免费工具,允许您分析图像以提取文本等数据并识别物体、人物、动物、植物等。您还可以使用它来搜索与提供的图像相似的视觉匹配项。

这个强大的工具对于消费者和企业都非常宝贵,它可以提供有关产品供应情况、价格和评论的见解。但是,手动从Google Lens提取数据可能非常耗时且效率低下。

本指南将引导您完成使用Scrapeless Google Lens API抓取Google Lens产品结果的过程,为您提供有效自动化此任务的工具和技术。

继续滚动!

了解Google Lens产品搜索

Google Lens使用先进的图像识别技术来识别图像中的产品。识别产品后,Google Lens会显示相关结果列表,包括产品名称、价格、零售商和评论。这些数据对于市场研究、价格比较和竞争对手分析至关重要。

然而,Google Lens的动态特性及其潜在的反抓取措施使得自动化数据提取极具挑战性。

抓取Google Lens的挑战

  • 动态内容: Google Lens依赖JavaScript动态加载数据。使用Selenium或Puppeteer等工具确保您的抓取器在提取信息之前等待所有元素加载完毕。
  • 反抓取措施: 通过轮换用户代理和使用代理将请求分散到多个IP地址来避免被检测。
  • 速率限制: 以受控的速度发送请求以避免IP被封禁。在请求之间引入延迟以模拟人类行为。

为什么我们应该使用API?

您可能希望使用API,特别是Scrapeless Google Lens API,原因如下:

  • 无需从头创建并维护解析器。
  • 绕过Google的封锁:解决验证码或IP封锁问题。
  • 无需付费购买代理和验证码求解器。
  • 无需使用浏览器自动化。

Scrapeless API在后端处理所有事务,响应时间非常快,每个请求不到~3.3秒,并且无需浏览器自动化,因此速度会快得多。

如何抓取Google Lens产品结果?

您的第一反应可能是尝试使用编程来实现抓取任务。但是,由于时间和精力限制🚫。大多数聪明的用户选择使用廉价且快速的API来完成复杂的数据提取。它可以通过简单的配置完成:

预备条件

首先,让我们建立与Google Lens API的连接并使用google_lens源。您可以按照我们文档中提供的说明操作。

步骤1:创建您的Google Lens API令牌

要开始,您需要从Scrapeless Dashboard获取您的API密钥:

  • 登录到Scrapeless Dashboard
  • 导航到API密钥管理
  • 点击创建以生成您的唯一API密钥。
  • 创建后,只需点击API密钥即可复制它。

步骤2:编写Python脚本以集成Scrapeless API

import json
import requests

class Payload:
    def __init__(self, actor, input_data):
        self.actor = actor
        self.input = input_data

def send_request():
    host = "api.scrapeless.com"
    url = f"https://{host}/api/v1/scraper/request"
    token = "your_token"

    headers = {
        "x-api-token": token
    }

    input_data = {
        "engine": "google_lens",
        "hl": "en",
        "country": "us",
        "search_type": "products",
        "url": "https://m.media-amazon.com/images/I/61iBtxCUabL._AC_UF894,1000_QL80_.jpg",
    }

    payload = Payload("scraper.google.lens", input_data)

    json_payload = json.dumps(payload.__dict__)

    response = requests.post(url, headers=headers, data=json_payload)

    if response.status_code != 200:
        print("Error:", response.status_code, response.text)
        return

    print("body", response.text)


if __name__ == "__main__":
    send_request()

替代方法:使用Playground

您也可以选择使用Scrapeless Playground来完成Google Lens产品的资料提取。

  • 创建API令牌后,点击Deep SerpApi
  • 找到Google Lens执行器
  • 添加您需要完成请求配置的参数。
  • 点击开始搜索并等待结果加载。
  • 导出结果

步骤3. 获取抓取结果

以下是部分抓取结果,仅供演示参考:

{
  "search_metadata": {
    "status": "success",
    "created_at": "2025-03-18 09:11:05 UTC",
    "processed_at": "2025-03-18 09:11:05 UTC",
    "google_lens_url": "https://lens.google.com/uploadbyurl?hl=en-sg&url=https%3A%2F%2Fm.media-amazon.com%2Fimages%2FI%2F61iBtxCUabL._AC_UF894%2C1000_QL80_.jpg",
    "total_time_taken": 6.667
  },
  "search_parameters": {
    "engine": "google_lens",
    "url": "https://m.media-amazon.com/images/I/61iBtxCUabL._AC_UF894,1000_QL80_.jpg",
    "search_type": "products"
  },
  "visual_matches": [
    {
      "position": 1,
      "title": "Apple Airpods 4 : Target",
      "link": "https://www.target.com/p/ap2022-true-wireless-bluetooth-headphones/-/A-85978615",
      "currency": "USD",
      "price": "$130*",
      "extracted_price": 130,
      "stock_information": "In stock",
      "source": "Target",
      ...

从Google Lens抓取数据是否合法?

抓取Google Lens数据并不违法,但需要遵守各种法律和道德准则。用户必须了解Google的服务条款、数据隐私法和知识产权,以确保其活动符合规定。通过遵循最佳实践并随时了解法律发展动态,您可以最大限度地降低与网络抓取相关的法律问题的风险。

Scrapeless Deep SerpAPI:强大的实时搜索数据解决方案

Deep SerpApi是一个实时搜索数据平台,专为AI应用和检索增强生成(RAG)模型而设计,提供实时、准确和结构化的Google搜索结果数据,支持超过20种Google SERP类型,包括Google搜索、Google趋势、Google购物、Google航班、Google酒店、Google地图等。

Deep SerpApi的优势有哪些?

  • 实时数据更新: 基于过去24小时内的数据更新,确保信息的及时性和准确性。
  • 多语言和地理位置支持: 支持多种语言和地理位置,可以根据用户的地理位置、设备类型和语言定制搜索结果。
  • 1-2秒响应: 平均响应时间仅为1-2秒,适合高频次和大规模数据检索。
  • 无缝集成: 与Python、Node.js、Golang等主流编程语言兼容,可以轻松集成到现有项目中。
  • 高性价比: 价格低至每1000次查询0.1美元,是市场上最具成本效益的SERP解决方案。

立即获得您的奖励!

赞助开发者计划正在进行中!前100位用户将获得50万次免费API调用,非常适合测试和扩展项目。

您可以将Deep SerpApi集成到您的AI工具、应用程序或您正在处理的任何项目中。我们支持Dify等框架(Langchain、Langflow、FlowiseAI以及许多其他框架即将推出!)。您还可以通过适合您项目的其他方式集成Scrapeless。

集成完成后,请通过GitHub或社交媒体与我们分享您的作品,并提供集成证明。作为回报,我们将为您提供为期1个月的50万次免费查询,以帮助您最大限度地利用我们产品的优势。

加入我们的社区并从我们的管理员Emily Fann那里获取详细信息!

底线

本教程介绍了如何使用Scrapeless的Google Lens API来抓取结果。按照我们的步骤,您可以轻松使用Scrapeless API来设置环境,提取相关数据,并将其保存到文件中以便轻松访问。

此外,Deep SerpApi Playground节省了我们许多不必要的复杂步骤。您只需进行简单的参数配置即可获得准确的数据结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值