主要使用的库:
requests:爬虫请求并获取源码
re:使用正则表达式提取数据
json:使用JSON提取数据
pandas:使用pandans存储数据
以下是源代码:
#!coding=utf-8
import requests
import re
import time
import json
from requests.packages.urllib3.exceptions import InsecureRequestWarning
import pandas as pd
requests.packages.urllib3.disable_warnings(InsecureRequestWarning) ###禁止提醒SSL警告
class tb(object):####手机端
def __init__(self,path,seach): ###保存数据路径
self.path = path ###保存数据路径
self.seach= seach ##搜索词
self.s = requests.session()
headers = {
'Host':'s.m.taobao.com',
'Accept-Encoding':'br, gzip, deflate',