Python爬虫练习二：爬取笔趣阁小说

最新推荐文章于 2024-05-01 21:57:08 发布

oneday_某天

最新推荐文章于 2024-05-01 21:57:08 发布

阅读量3.4k

点赞数 2

分类专栏： python爬虫

本文链接：https://blog.csdn.net/weixin_41710905/article/details/80501892

版权

python爬虫专栏收录该内容

6 篇文章 1 订阅

订阅专栏

爬取这个小说网站真的很EASY！很有成就感~适合爬虫的初学者！

以一个叫《凡人修仙传仙剑篇》的小说作为目标进行爬取测试。

废话不多说，上代码！

import requests
from bs4 import BeautifulSoup
aimurl="http://www.biquge.com.tw/18_18998/"#爬虫目标网址
url="http://www.biquge.com.tw"#href前面的内容
#输入网址 获得网页的soup
def getsoup(url):
   res=requests.get(url) #以get方法访问目标网址获取网页信息
   res.encoding= 'gb2312'#该网页是以gb2312的编码形式显示的
   soup=BeautifulSoup(res.text, 'html.parser')#使用美丽汤解析网页内容
   return soup

soup=getsoup(aimurl)

chapterlist=[]#存放章节的url
chaptertextlist=[]#存放章节标题
for i in soup.select('.box_con #list a'):
    chapterlist.append(url+i['href'])
    chaptertextlist.append(i.text)
#分析章节内容，并写入txt文本
for i,j in zip(chapterlist,chaptertextlist):
    tempsoup = getsoup(i)
    temptext=tempsoup.select('#content')[0].text#正文内容在属性content下   class用.xx  属性＃
    path=r'E:\fanren.txt'
    with open(path,'a',encoding='utf-8') as f:
        f.write(j+'\n'+temptext+'\n')

没有太多要说明的，通过更改aimurl基本可以实现爬取该小说网站的任何一部小说。

oneday_某天

关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
2
评论
Python爬虫练习二：爬取笔趣阁小说

爬取这个小说网站真的很EASY！很有成就感~适合爬虫的初学者！以一个叫《凡人修仙传仙剑篇》的小说作为目标进行爬取测试。废话不多说，上代码！import requestsfrom bs4 import BeautifulSoupaimurl="http://www.biquge.com.tw/18_18998/"#爬虫目标网址url="http://www.biquge.com.tw"#hre...
复制链接

扫一扫