python抓取小说_python抓取小说

最新推荐文章于 2024-08-16 08:20:25 发布

橙市

最新推荐文章于 2024-08-16 08:20:25 发布

阅读量214

点赞数

文章标签： python抓取小说

本文链接：https://blog.csdn.net/weixin_42347415/article/details/113982162

版权

http://www.crummy.com/software/BeautifulSoup/

from html.parser import HTMLParser

from bs4 import BeautifulSoup as bs

import urllib.request

import re

def parsechapter(url, out):

data = urllib.request.urlopen(url)

dataDecode = data.read().decode('utf-8')

data.close()

soup = bs(dataDecode)

for content in soup.findAll(id="chapterContent"):

for nc in content.findAll("p"):

print(nc.span.previousSibling, file=out)

try

a_file = open("test.txt", mode="a", encoding="utf-8")

showchapter_url = 'http://book.zongheng.com/showchapter/189169.html'

chapterData = urllib.request.urlopen(showchapter_url)

chapterDataDecode = chapterData.read().decode('utf-8')

chapterData.close()

chapterDataSoup = bs(chapterDataDecode)

for chapters in chapterDataSoup.findAll("div", attrs={'class':"booklist"}):

for chapter in chapters.findAll("a"):

print(chapter.get_text(), file=a_file)

parsechapter(chapter['href'], a_file)

except IOError:

print('file error!')

finally:

if 'a_file' in locals():

a_file.close()

分享到：

2012-11-07 14:29

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

橙市

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python爬取小说

SunCherryDream的专栏

01-16

1299

想把顶点小说网上的一篇持续更新的小说下下来，就写了一个简单的爬虫，可以爬取爬取各个章节的内容，保存到txt文档中，支持持续更新保存。需要配置一些信息，设置文档保存路径，书名等。写着玩，可能不大规范。 # coding=utf-8 import requests from lxml import etree from urllib.parse import urljoin import re

python抓取数据包_python抓数据包

weixin_39687621的博客

11-29

1702

广告关闭腾讯云11.11云上盛惠，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高返5000元！前言：数据科学越来越火了，网页是数据很大的一个来源。最近很多人问怎么抓网页数据，据我所知，常见的编程语言(c++,java,python)都可以实现抓网页数据，甚至很多统计计算的语言(r,matlab)都有可以实现和网站交互的包。本人试过用java,python,r抓网页，感觉语...

参与评论您还未登录，请先登录后发表或查看评论

python小说阅读系统

11-18

python小说阅读系统，可注册，可登陆，有排行榜（推荐、打赏、点击榜），可充值，可打赏，可推荐。github上有：https://github.com/yuMoyu/novel。csdn的积分总是自动涨

用python给自己DIY一款小说阅读器

weixin_30670151的博客

06-26

929

前一段时间书荒的时候，在喜马拉雅APP发现一个主播播讲的小说-大王饶命。听起来感觉很好笑，挺有意思的，但是只有前200张是免费的，后面就要收费。一章两毛钱，本来是想要买一下，发现说的进度比较慢而且整本书要1300多张，算了一下，需要200大洋才行，而且等他说完，还不知道要到什么时候去。所以就找文字版的来读，文字版又有它的缺点，你必须手眼联动才行。如果要忙别的事情，但是又抑制不住想看的冲动，就很纠结...

FictionDown：高效的小说爬取工具

最新发布

gitblog_00078的博客

08-16

561

python获取小说内容

weixin_30295091的博客

10-23

155

在使用前要安装python的第3方库，BeautifulSoup，pymysql 代码里面用了mysql数据库代码里面获取小说网站地址是：http://www.kbiquge.com mysql里面的表结构： CREATE TABLE `story` ( `id` varchar(200) NOT NULL DEFAULT '', `name` varch...

细说Python爬虫爬取小说

weixin_44238730的博客

04-19

3398

我们爬取的是诗词名句网的三国演义，这个会爬了其余都同理了。我喜欢先上代码说话。 # 爬取三国演义-----------预备阶段 from bs4 import BeautifulSoup import requests url = 'http://shicimingju.com' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT ...

Web-Scraping-with-Python_Python网页信息抓取_Python抓取网页_jupyter_Python抓

09-11

**Python网页信息抓取技术详解** 网页信息抓取，也称为网络爬虫或网页抓取，是通过自动化程序从互联网上获取大量数据的过程。在这个领域，Python语言因其强大的库支持和简洁的语法而成为首选工具。本教程将深入探讨...

tushare.rar_python 抓取股票_tushare实时数据_tushare抓取股票_股票 python_获取美股数据

07-15

综上所述，通过Python的tushare库，我们可以方便地抓取股票实时数据，包括获取美股数据。同时，结合其他数据源，如Yahoo Finance，可以进一步丰富我们的数据获取和分析能力。在实际项目中，我们可以根据需求编写相应...

ZQ.rar_python_抓取_抓取图片

09-23

标题中的"ZQ.rar_python_抓取_抓取图片"暗示了这个压缩包包含了一个Python脚本（ZQ.py）和可能的一些结果图片，用于演示或记录如何使用Python进行网络图片的抓取过程。描述进一步确认了这个主题，即利用Python进行...

PYTHON 与小说

攀爬者

11-28

343

我是PYTHON初学者，这是我写的一个简单的爬虫。脚本如下： #!/usr/bin/python # -*- coding: UTF-8 -*- import requests import re import sys reload(sys) sys.setdefaultencoding('utf8') from bs4 import BeautifulSoup file_name='E:\Do

python爬小说

小熊提伯斯的博客

10-30

2975

环境:python3.6 + pyquery 目标链接：http://www.136book.com/huaqiangu/ 使用Python爬取花千骨小说 #!/usr/bin/env python # -*- coding: utf-8 -*- import requests from pyquery import PyQuery as pq url = 'http://www.136b...

用python爬取小说信息（简易版）

without_scruple的博客

09-23

1707

用python爬取小说内容（简易版）

用Python爬取小说

LM813381916的博客

09-20

4970

Python爬取小说《北派盗墓笔记》，内容来自互联网

python 小说小说_我用Python实现了一个小说网站雏形

weixin_30386401的博客

02-03

512

前言前段时间做了一个爬取妹子套图的小功能，小伙伴们似乎很有兴趣，为了还特意组建了一个Python兴趣学习小组，来一起学习。十个python九个爬，在大家的印象中好像Python只能做爬虫。然而并非如此，Python 也可以做Web开发，接下来给大家展示一下如何做一个小说站点。相关软件软件版本功能地址Python3.7.1脚本语言https://www.python.org/Django2.1.3W...

使用Python爬取小说

热门推荐

洋洋的博客

03-05

1万+

爬取网站：http://www.biqugecom.com/ 爬取方式：整站爬取，就是把该站所有的小说都爬下来。本次爬取涉及到的知识点有： Xpath 类的定义及使用 requests库的使用准备工作安装requests库： pip3 install requests 安装lxml库： pip3 install lxml 分析网站：得到每个分类的页面的链接只有...

python爬虫之爬取网站小说，获取一部小说

qq_46292926的博客

03-12

520

python爬虫之爬取网站小说，由于学习没多久，许多小细节还不是很理解清楚，在大佬的帮助下，完成了这篇。代码仅作参考： ''' 函数式编程纵横中文网爬取阴阳酒馆小说 ''' # 导入第三方库 import requests from lxml import etree import time import os from fake_useragent import UserAgent ua ...

python 小说-用Python爬下十几万本小说，再也不会闹书荒！

weixin_37988176的博客

11-01

473

原标题：用Python爬下十几万本小说，再也不会闹书荒！自从看了师傅爬了顶点全站之后，我也手痒痒的，也想爬一个比较牛逼的小说网看看，于是选了宜搜这个网站，好了，马上开干，这次用的是mogodb数据库，感觉mysql太麻烦了下图是我选择宜搜里面遍历的网站先看代码框架图第一个，肯定先提取排行榜里面每个类别的链接啊，然后进入链接进行爬取，先看all_theme文件看看运行结果，这是书籍类目的这是...

Python_Python网络小说爬虫

Tingshuo2009的博客

04-10

353

前言：为了搭建爬虫基础框架，测试正则表达式，最初目的是帮别人下载一篇小说，所以进行爬虫试验，小说地址：http://dangdu.dangdang.com/catalog/167378.shtml，项目编辑的IDE为PyCharm PROFESSIONAL 2019.3，编码过程中用到了python中的两个库，分别是re、urllirb。其实，等到这篇小说爬取完...

Python网页抓取入门与方法详解

在Python中进行页面抓取是一项常见的任务，特别是在数据分析和自动化任务中，了解如何有效地提取和处理网页数据至关重要。本文将介绍几种Python中常用的抓取页面的方法，适合初学者入门。首先，让我们来看一个基础...