基于request+re路线的淘宝商品信息的定向爬虫
python爬虫实例讲解
1.爬取网页
通过导入request,re库,首先编写一个将淘宝商品页爬取的函数,此时一个注意点是要将自己头部的user agent伪装成浏览器(淘宝会拒绝爬虫请求),并且采用设计好的cookie,放入request.get的参数中,返回网页信息。`
import requests
import re
def get_html_text(url):
headers...
原创
2020-04-03 16:46:04 ·
824 阅读 ·
1 评论