python爬取BT之家特定频道前5页电影信息(小白操作)

本文介绍了一个新手如何使用Python爬取BT之家恐怖频道的前5页电影信息,将数据保存为XLS文件的过程。代码简单易懂,适合初学者参考,同时也表达了作者期待优化代码的愿望。
摘要由CSDN通过智能技术生成

python爬取BT之家特定频道前5页电影信息(小白操作)

想要爬的网页如下,希望得到BT之家恐怖频道的电影信息,并存档xls

在这里插入图片描述

代码如下

import requests,openpyxl
wb=openpyxl.Workbook()  
#创建工作薄
sheet=wb.active 
#获取工作薄的活动表
sheet.title='horror' 
#工作表重命名

sheet['A1'] ='电影信息'     #加表头,给A1单元格赋值

from bs4 import BeautifulSoup
#引入request和bs

for x in range(5):
    url='http://www.7btjia.com/forum-index-fid-1-typeid1-0-typeid2-164-typeid3-0-typeid4-0-page-'+str(x+1)+'.htm'
    #观察网站翻页结构(此处在Elements用网页的底部页码导航定位代码处,观察不同页码的网址规律)

    headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}

    res=requests.get(url,headers=headers)
 
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值