小说采集,采集笔趣阁小说网站(www.biquges.cc)

小说采集一直是站主比较头大的一件事,接下来我将给大家分享用python采集笔趣阁小说站,可能会多写几篇,不足之处大家多多指教
目标站:www.biquges.cc

先采集小说资源链接
代码中是将所有采集到的链接存放到列表中,有需要的同学可以自己写sql语句存放到数据库中或者保存到txt文件中
#coding=utf-8
import requests
class GetList:
“”"
获取小说列表链接
“”"
def getlist(self,start_num,end_num):
lis=[]
for i in range(start_num,end_num):
url=“http://www.biquges.cc/b
url=url+str(i)
#获取网页状态吗,如果是200就添加到采集资源池中
status=requests.get(url).status_code
if status==200:
lis.append(url)
else:
continue

    print(lis)

if name==“main”:
gl=GetList()
gl.getlist(start_num=1,end_num=3)

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
好的,我可以为你编写一个简单的小说下载器界面,使用Python的tkinter库实现。在这个界面上,你可以输入小说的网址和要下载的章节范围,然后点击“下载”按钮开始下载。 为了从笔趣阁下载小说,我们将使用requests和BeautifulSoup库来解析HTML页面和下载小说。在开始之前,请确保你已经安装了这些库。 以下是代码实现: ```python import requests from bs4 import BeautifulSoup import tkinter as tk from tkinter import ttk from tkinter import messagebox class NovelDownloader: def __init__(self, url, start, end): self.url = url self.start = start self.end = end self.chapter_urls = [] self.chapter_texts = [] def get_chapter_urls(self): response = requests.get(self.url) soup = BeautifulSoup(response.text, 'html.parser') chapter_list = soup.find_all('div', id='list')[0].find_all('a') self.chapter_urls = [self.url + i['href'] for i in chapter_list[self.start-1:self.end]] def get_chapter_texts(self): for url in self.chapter_urls: response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') chapter_title = soup.find_all('div', id='maininfo')[0].find_all('h1')[0].text chapter_text = soup.find_all('div', id='content')[0].text.replace('\xa0','\n') self.chapter_texts.append(chapter_title + '\n\n' + chapter_text) def save_to_file(self): with open('novel.txt', 'w', encoding='utf-8') as f: f.write('\n\n'.join(self.chapter_texts)) class NovelDownloaderGUI: def __init__(self, root): self.root = root self.root.title('小说下载器') self.root.geometry('400x200') self.url_label = ttk.Label(self.root, text='小说网址:') self.url_label.grid(column=0, row=0, padx=5, pady=5) self.url_entry = ttk.Entry(self.root, width=30) self.url_entry.grid(column=1, row=0, padx=5, pady=5) self.range_label = ttk.Label(self.root, text='章节范围:') self.range_label.grid(column=0, row=1, padx=5, pady=5) self.start_entry = ttk.Entry(self.root, width=5) self.start_entry.insert(0, '1') self.start_entry.grid(column=1, row=1, padx=5, pady=5) self.end_label = ttk.Label(self.root, text='到') self.end_label.grid(column=2, row=1, padx=5, pady=5) self.end_entry = ttk.Entry(self.root, width=5) self.end_entry.insert(0, '10') self.end_entry.grid(column=3, row=1, padx=5, pady=5) self.download_button = ttk.Button(self.root, text='下载', command=self.download_novel) self.download_button.grid(column=1, row=2, padx=5, pady=5) def download_novel(self): url = self.url_entry.get() start = int(self.start_entry.get()) end = int(self.end_entry.get()) downloader = NovelDownloader(url, start, end) downloader.get_chapter_urls() downloader.get_chapter_texts() downloader.save_to_file() messagebox.showinfo('提示', '下载完成!') if __name__ == '__main__': root = tk.Tk() app = NovelDownloaderGUI(root) root.mainloop() ``` 这个小说下载器界面包括一个文本框和两个输入框,以及一个“下载”按钮。当你在文本框中输入小说的网址,并指定要下载的章节范围时,点击“下载”按钮,程序将会自动从笔趣阁下载小说,并保存到一个名为“novel.txt”的文本文件中。 请注意,这个小说下载器只适用于笔趣阁,对于其他小说网站可能需要做一些修改才能正常使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值