爬虫实践---抓取小说网站

 

电子书网站:

http://www.qu.la/paihangbang/

 

对网页进行分析可知,

 <div class="index_toplist mright mbottom">
            <div class="toptab" id="top_all_1">
                <span>玄幻奇幻排行</span>
<div class="index_toplist mright mbottom">
            <div class="toptab" id="top_all_2">
                <span>武侠仙侠排行</span>

<div class="index_toplist  mbottom">
            <div class="toptab" id="top_all_4">
                <span>历史军事排行</span>

<div class="index_toplist mbottom">
            <div class="toptab" id="top_all_8">
                <span>完本小说排行</span>


观察发现,历史军事和完本小说的时一致的,其余类别是一样的,所以进行分开处理。

每一个分类都是包裹在: 

<div class="index_toplist mright mbottom">

之中 这种调理清晰的网站,大大方便了我们爬虫的编写

一个类别里,出现了排行榜上所有的小说:


<div class="index_toplist mright mbottom">
<div class="toptab" id="top_all_1">
<span>玄幻奇幻排行</span><div>
<div class="topbooks" id="con_o1g_1" style="display: block;">
<ul>
<li><span class="hits">05-06</span><span class="num">1.</span><a href="/book/168/" title="择天记" target="_blank">择天记</a></li>


                        <li><span class="hits">05-06</span><span class="num">2.</span><a href="/book/176/" title="大主宰" target="_blank">大主宰</a></li>


                <!--中间省略了不少 -->


                        <li><span class="hits">05-06</span><span class="num">3.</span><a href="/book/4140/" title="太古神王" target="_blank">太古神王</a></li>


                        <li><span class="hits">05-06</span><span class="num">4.</span><a href="/book/5094/"
  • 3
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值