Python爬虫入门笔记_三行代码爬出数据

燕山刘同学

已于 2022-05-24 20:55:50 修改

阅读量238

点赞数

文章标签： python 爬虫开发语言

于 2022-05-09 12:03:42 首次发布

本文链接：https://blog.csdn.net/weixin_41900500/article/details/124662582

版权

笔记专栏收录该内容

3 篇文章 1 订阅

订阅专栏

理论梳理

爬虫个人理解：用代码在网页上循着线索收集数据
URL：（Uniform Resource Locator）指定信息位置的表示方法
爬虫思路：根据URL去获取目标信息
使用的功能包：requests
流程图：

举例

从JD上获取某款口红的评论区内容，代码和注释如下：

import requests     #引入功能包_第一行代码
a = requests.get('https://club.jd.com/comment/
productPageComments.action?callback=fetchJSON_c
omment98&productId=100006262957&score=0&sortType=5&pa
ge=0&pageSize=10&isShadowSku=0&fold=1')     #通过URL获取目标内容_第二行代码_括号里的内容是口红评论内容的URL
b = a.text    #将获取的内容写为无格式文本_第三行代码

print(b) #将文本输出