主要使用的库:
requests:爬虫请求并获取源码
re:使用正则表达式提取数据
json:使用JSON提取数据
pandas:使用pandans存储数据
#!coding=utf-8
import requests
import os
import re
import json
import datetime
import time
import pandas as pd
from requests.packages.urllib3.exceptions import InsecureRequestWarning
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)
import win32api,win32con
def raw(text): # 转化URL字符串
escape_dict = {
'/': '%252F',
'?': '%253F',
'=': '%253D',
':': '%253A',
'&': '%26',
}
new_string = ''
for