【Python】一键爬取金庸连载版/三联版/世纪新修版小说

博主分享了如何使用Python一键爬取金庸的连载版、三联版和世纪新修版小说的经历,因为在网上找到的资源存在乱码和无目录问题,决定自己动手解决。文中提到虽然纸质书阅读体验更好,但为了方便,决定编写代码进行爬取。已整理好的小说资源可供需要的人索取。
摘要由CSDN通过智能技术生成

上次爬了射雕英雄传连载版,时隔一年,在看倚天屠龙记连载版的时候,是之前在网上找的资源,居然有乱码,又不好再找资源
而且对网上资源导入多看阅读后没有目录早已不爽,索性自己动手.
其实要说看书,还是看纸质版的好,手机看,少那么点意思还伤眼.
不想爬取的话,可以找我要我已经整理好的小说
代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@Time    : 2019/12/14 10:20
@Author  : YuJinNeng
@Site    :
@File    : 爬取代码.py
@Software: PyCharm
"""
import random
import time
from bs4 import BeautifulSoup
from urllib import request
import re


def down_txt(href_content, book_name):
    html_addr = "http://www.jinyongwang.com" + href_content
    html_content = request.urlopen(html_addr).read()
    soup = BeautifulSoup(html_content, 'html.parser')
    author = str(soup.select('.author')[0])
    author_content = re.findall('<p class="author">(.*?)<a', author)[0]
    author_name = re.findall(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值