如何把晋江已经购买的小说(VIP的也够买了)全部下载到本地呢?

小说app下载后找不到文档、没路径导出的情况可以尝试以下方法:

注意:以下方法仅可用作个人学习使用,不得用作传播盗版或其他任何用途及目的
[材料]Win10操作系统·、Edge浏览器 (win10自带)
[提示] 小说付费章节需用户购买后才能正常使用,否则输出结果可能为空白!
[注意]使用浏览器插件9时需自行鉴别是否安全,我无法确保以下提到的内容都是绝对安全的

**

[方法1] (操作难度:中;效率:极高,可一次下载多章节为.txt文件)

**

如果不会安装浏览器插件,建议使用windows自带的edge浏览器跟随教程若出现失效或部分网站不可用,可尝试更新插件,或向插件作者反馈

步骤1:

下载: 油猴 (tampermonkey) 浏览器插件
Edge浏览器才能获取:
https://microsoftedge.microsoft.com/addons/search/tampermonkey
在这里插入图片描述

安装:点击“获取”>“添加”即可

步骤2:

下载:小说下载器(novel-downloader)

在这里插入图片描述
如果链接打不开,可以浏览器搜索Greasy Fork,找作者:bgme
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在管理面板中确保 novel-downloader 是打开的

在这里插入图片描述
建议重启浏览器

步骤3:

详细看插件介绍(看清支持的平台)

在这里插入图片描述
在这里插入图片描述
记得登入账号,主页即可完整下载
在这里插入图片描述
在这里插入图片描述

[方法2] (操作难度: 低,效率: 低)

解除网页禁止复制的限制。但部分网站会对字体加密,强行复制的文本可能异常.

步骤1:

通过[Edge 外接程序]任意选择一款解除复制限制的插件即可,使用方法点进插件的详细页面一般都会有。
下载:https://microsoftedge.microsoft.com/addons/Microsoft-Edge-Extensions-Home

安装: 点击“获取”>“添加”即可

在这里插入图片描述
[开关/移除]
如果想 开启/关闭/删除 油猴里面的插件可通过

在这里插入图片描述
以上内容部分来自乎网友的分享

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
首先,你需要安装以下几个库:requests、beautifulsoup4 和 pandas。在Jupyter Notebook中打开一个新的Python文件,然后按照以下步骤开始爬取晋江文学网上的小说数据: 1. 导入所需的库: ```python import requests from bs4 import BeautifulSoup import pandas as pd ``` 2. 确定要爬取的小说的URL: ```python url = 'https://www.jjwxc.net/onebook.php?novelid=123456' ``` 请将"123456"替换为你想要爬取的小说的实际ID号。 3. 使用requests库获取HTML源代码: ```python response = requests.get(url) html = response.content ``` 4. 使用BeautifulSoup库解析HTML源代码: ```python soup = BeautifulSoup(html, 'html.parser') ``` 5. 找到包含小说章节列表的HTML元素: ```python chapter_list = soup.find('div', {'class': 'booklast'}) ``` 6. 找到所有小说章节的链接和标题: ```python chapter_links = chapter_list.find_all('a') chapter_titles = [chapter.text for chapter in chapter_links] chapter_urls = ['https://www.jjwxc.net/' + chapter.get('href') for chapter in chapter_links] ``` 7. 遍历所有章节链接,获取每章节的HTML源代码: ```python chapter_html = [] for chapter_url in chapter_urls: chapter_response = requests.get(chapter_url) chapter_html.append(chapter_response.content) ``` 8. 使用BeautifulSoup库解析每章节的HTML源代码,并提取章节内容: ```python chapter_content = [] for chapter in chapter_html: chapter_soup = BeautifulSoup(chapter, 'html.parser') chapter_content.append(chapter_soup.find('div', {'class': 'noveltext'}).text) ``` 9. 将小说章节的标题和内容储到一个Pandas DataFrame中: ```python novel_df = pd.DataFrame({'title': chapter_titles, 'content': chapter_content}) ``` 现在,你已经成功地爬取了晋江文学网上的小说数据,并将其储在一个DataFrame中。可以使用Pandas的导出功能将数据导出为CSV或Excel文件,以便进一步分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值