爬虫入门实践 | 利用python爬取彩票中奖信息

最新推荐文章于 2023-06-06 13:30:00 发布

喂鱼W_y

最新推荐文章于 2023-06-06 13:30:00 发布

阅读量7.6k

点赞数 1

分类专栏： python 爬虫

本文链接：https://blog.csdn.net/wyisfish/article/details/81139354

版权

系统环境：mac python版本：3.6.2(anaconda) 库：requests、BeautifulSoup爬取一些简单的静态网站，一般采取的策略为：选中目标，也就是需要爬取的网站url；观察结构，查看网页结构，联接结构；构思动手，选择Html下载器和解析器，最后存储数据。今天我们爬取对象是中彩网中3D彩票中奖信息。对应的URL为：http://kaijiang.zhcw...

摘要由CSDN通过智能技术生成

系统环境：mac
python版本：3.6.2(anaconda)
库：requests、BeautifulSoup

爬取一些简单的静态网站，一般采取的策略为：选中目标，也就是需要爬取的网站url；观察结构，查看网页结构，联接结构；构思动手，选择Html下载器和解析器，最后存储数据。

今天我们爬取对象是中彩网中3D彩票中奖信息。对应的URL为：http://kaijiang.zhcw.com/zhcw/html/3d/list_1.html。
我们可以发现，其后缀list_()代表的正是第几页，比如list_3就是第三页。
这里写图片描述
我们打开开发者工具查看网页结构，可以发现每一期的彩票信息对应的源代码是一个tr节点，我们可以使用BeautifulSoup库来提取数据信息。

整体流程：爬取所有3D彩票信息248页，一共请求248次网页，使用库提取信息，使用xlrd将数据写入excel。结果如下：

这里写图片描述
代码如下：

import requests
import xlwt
import time
from bs4 import BeautifulSoup

# 获取网页内容
def get_html(url):
    headers = {
        'User-Agent':

最低0.47元/天解锁文章

喂鱼W_y

关注

1
点赞
踩
29

收藏

觉得还不错? 一键收藏
5
评论
爬虫入门实践 | 利用python爬取彩票中奖信息

系统环境：mac python版本：3.6.2(anaconda) 库：requests、BeautifulSoup爬取一些简单的静态网站，一般采取的策略为：选中目标，也就是需要爬取的网站url；观察结构，查看网页结构，联接结构；构思动手，选择Html下载器和解析器，最后存储数据。今天我们爬取对象是中彩网中3D彩票中奖信息。对应的URL为：http://kaijiang.zhcw...
复制链接

扫一扫

专栏目录