python爬虫学习爬取股票数据

本文介绍了使用Python爬虫抓取股票数据的步骤,包括导入必要的模块,分析网页源代码获取URL,构造请求头,通过正则表达式匹配数据,并将数据整合存储到MySQL数据库中。
摘要由CSDN通过智能技术生成

1.首先要导入几个模块

import requests
import pandas as pd
import re
import time
import random
from sqlalchemy import create_engine

2.要想爬取一个网页之前要先了解这个网页的源代码,按F12进入开发者工具,得到如下界面:

找到要爬取的网页的真实页面,可以看到要爬取的数据就在里面。点开Headers可以看到Request URL,所以这个网址就是要爬取的数据的网址。同时pn也代表页数,所以如果想要获取多页的数据,可以写一个for循环。

3.下面就开始进行数据的爬取。

#构造请求头,这里在爬虫中添加字典类型的请求头headers的目的是为了将python伪装成一个真实的浏览器,进而促使被访问的网站将python当作一个正常的访问用户。代码如下

headers={
'Accept': '*/*',
'Accept-Encoding': 'gzip, deflate',
'Accept-Language': 'zh-CN,zh;q=0.9',
'Connection': '

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值