三行代码爬取京东数据

本文介绍了如何使用Python通过三行代码爬取京东商品评论数据。首先,解释了爬虫的工作原理,模拟浏览器向服务器发送请求并获取响应。接着,详细说明了如何找到评论数据背后的URL,包括在浏览器开发者工具中监控网络请求的步骤。最后,提到了使用requests库进行HTTP请求,获取并打印评论数据。
摘要由CSDN通过智能技术生成

三行代码爬取京东数据

潦潦草草

python学习

  1. 了解python爬虫
    python程序里,爬取网络数据的虫子叫爬虫,它的实质是模拟浏览器的工作原理,向服务器请求相应的数据。
  2. 浏览器的工作原理
    浏览器向服务器发送请求,服务器给予浏览器相应的响应,然后浏览器翻译解析才让我们看到了真正的界面。
  3. 爬虫的工作原理
    python向京东的服务器发送请求,服务器给予python相应的响应,然后python提取想要的数据。

关于数据

  1. 所找的商品销售数据
    通过评论数据间接得到鞋子的销售数据
  2. 寻找评论区内容背后的URL(网址)
    a. 鼠标右击选择检查,或者f12,打开程序员调试窗口,点击network
    b. 刷新当前页面
    c. 复制一小段评论区内容,粘贴到程序员调试窗口内搜索框
    d. 点击刷新
    e. 点击查询结果跳到对应请求
    f. 点击Headers, 找到Resquest URL即是评论区数据背后的URL

关于代码

引入python工具包requests
使用工具包中get方法,向服务器发起请求
打印输出请求回来的数据(print)即可

举例:爬取一页京东上销量较高的口红评论区数据

import requests
resp <
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值