记python爬虫第一战,爬取小说,并写入txt文件

记python爬虫第一战,爬取小说,并写入txt文件

本文介绍了一个及其简单的爬虫实例,使用python版本为3.7

一、使用到的库文件有:

      requests:用于get请求
      bs4:用于网页请求
      codecs:用于读写文件

二、对网页文件结构进行分析(PS:浏览器使用的是360浏览器)

  1. 目标网页:https://www.zwdu.com/book/7586
    在这里插入图片描述
    2.首先获得每一章节的URL,鼠标放在某一章节上,右键——审查元素
    在这里插入图片描述
  2. 这儿就是我们要的URL了在这里插入图片描述
  3. 我们的目标在
<div id="list">下的<dd>内的<a>标签内

4.一下为获取URL的代码

// An highlighted block
import requests
import codecs
from bs4 import BeautifulSoup
re=requests.get('https://www.zwdu.com/book/7586/')
html=re.content
soup=BeautifulSoup(html,'html.parser')
body=soup.body
data=body.find('div',{
   'id':'list'})
dd=data.find_all('dd')
for n in dd:
    txt=n.find('a').string
    url=n.find(
  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值