1、需要导入的包
import requests
import pandas as pd
import re
import pymysql
import numpy as np
from sqlalchemy import create_engine
2、爬取一个网页首先需要了解这个网页的源代码,按F12就可以进入开发者工具。
点开network,刷新一下,会弹出相应的get?cb开头的请求,点开可以看到我们要爬取的数据就在这个里面。
然后点开Headers可以看到有个Request URl,点开连接可以直接看到数据,所以不用添加请求头 就能获取。
3、进行爬取
#获取网页源代码
url=f'http://push2his.eastmoney.com/api/qt/stock/fflow/daykline/get?cb=jQuery112309173939785847636_1634476786717&lmt=0&klt=101&fields1=f1%2Cf2%2Cf3%2Cf7&fields2=f51%2Cf52%2Cf53%2Cf54%2Cf55%2Cf56%2Cf57%2Cf58%2Cf59%2Cf60%2Cf61%2Cf62%2Cf6