Python爬虫练习二:爬取笔趣阁小说

爬取这个小说网站真的很EASY!很有成就感~适合爬虫的初学者!

以一个叫《凡人修仙传仙剑篇》的小说作为目标进行爬取测试。

废话不多说,上代码!

import requests
from bs4 import BeautifulSoup
aimurl="http://www.biquge.com.tw/18_18998/"#爬虫目标网址
url="http://www.biquge.com.tw"#href前面的内容
#输入网址 获得网页的soup
def getsoup(url):
   res=requests.get(url) #以get方法访问目标网址获取网页信息
   res.encoding= 'gb2312'#该网页是以gb2312的编码形式显示的
   soup=BeautifulSoup(res.text, 'html.parser')#使用美丽汤解析网页内容
   return soup

soup=getsoup(aimurl)

chapterlist=[]#存放章节的url
chaptertextlist=[]#存放章节标题
for i in soup.select('.box_con #list a'):
    chapterlist.append(url+i['href'])
    chaptertextlist.append(i.text)
#分析章节内容,并写入txt文本
for i,j in zip(chapterlist,chaptertextlist):
    tempsoup = getsoup(i)
    temptext=tempsoup.select('#content')[0].text#正文内容在属性content下   class用.xx  属性#
    path=r'E:\fanren.txt'
    with open(path,'a',encoding='utf-8') as f:
        f.write(j+'\n'+temptext+'\n')
没有太多要说明的,通过更改aimurl基本可以实现爬取该小说网站的任何一部小说。
  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值