python调用shell脚本的参数_python调用shell脚本 参数python下载小说

本文作者利用Python编写脚本,实现对笔趣阁网站小说的自动化下载,包括首页小说抓取、内容解析及章节下载。通过设置超时和异常处理解决了下载过程中遇到的问题。

我以前喜欢看小说,玄幻,武侠,修真是我的最爱,刚学python不久,出于我对小说的热爱,我写了个脚本用来下载我经常看的笔趣阁网站首页所有的小说

首先得到网站首页的html,分析首页中有多少小说,循环得到小说的html,提取出小说名字,创建小说名字为名的文本,将每一章节的章节名和内容提取出来写入到文本中,循环直到最后一个章节,然后开始下一本小说

W WW.002pc .COM认为此文章对《python调用shell脚本 参数python下载小说》说的很在理。

我这里是先把html下载到本地G:\url\中,然后读取的,其实直接打开url也可以。之前运行时有时候会卡在某个地方,得不到某个网页,我以为是缓存的问题,其实不是。解决方法是我设置了五秒中的超时和异常处理。如果五秒钟得不到这一章节的页面那么就跳过下载下一章

# -*- coding: utf-8 -*-

# -------------------------------------------

# 下载http://www.biquge.la笔趣阁首页上显示的所有小说

# 下载的小说存放在G:\txt文件夹下

# -------------------------------------------

# 2014/8/23

# wyp

# -------------------------------------------

import re

import urllib

import os

import socket

def getHtml(url):

reg = r'http:\.\.(.*)'

res = re.compile(reg)

urlstr = url.replace('/', '.')

print urlstr

name = re.findall(res, urlstr)

urlpathname = r'G:\url' +'\\' + name[0]

print 'urlpathname = '+urlpathname

try:

socket.setdefaulttimeout(5.0)

urllib.urlretrieve(url, urlpathname)

except:

pass

print 'getHtml ---------------over'

return urlpathname

def getBook(html):

reg = r'(.*?)'

res = re.compile(reg)

zhangJie = re.findall(res, html)

return zhangJie

def getContent(html):

reg = r'

(.*?)
'

res = re.compile(reg)

content = re.findall(res, html)

return content

if __name__ == "__main__":

url = raw_input("please input url: ")

urlpathname = getHtml(url)

print urlpathname

f1 = open(urlpathname, 'rb+')

html = f1.read()

print html

Book = getBook(html)

#去重保持元素顺序

book = list(set(Book))

book.sort(key=Book.index)

for b in book:

realurl = url + '/book/' + b + '/'

print realurl

realurlname = getHtml(realurl)

print realurlname

f2 = open(realurlname, 'rb+')

realhtml = f2.read()

BookName = getName(realhtml)

filepath = os.path.join(r"G:\txt", BookName[0])

filename = filepath + '.txt'

print filename

if os.path.exists(filename):

continue

fd = open(filename, 'w+')

zhangjie = getZhangJie(realhtml)

for zj in zhangjie:

sonurl = realurl + zj[0]

print "url = %s" % sonurl

try:

sonurlname = getHtml(sonurl)

print '-----'+sonurlname

except:

continue

try:

f3 = open(sonurlname, 'rb+')

except IOError:

continue

sonhtml = f3.read()

zhangjieming = getName(sonhtml)

if len(zhangjieming) == 0:

continue

fd.write('\t\t\t\t\t' + zhangjieming[0] + '\r\n')

print "downding " + zhangjieming[0]

fd.write('\r\n')

fd.flush()

try:

content = getContent(sonhtml)

except:

pass

if len(content) == 0:

continue

c1 = content[0].replace('
', '')

c2 = c1.replace(' ', ' ')

fd.write(c2)

fd.write('\r\n\r\n\r\n\r\n')

fd.flush()

fd.close()

f2.close()

f3.close()

更多:python调用shell脚本 参数python下载小说

https://www.002pc.comhttps://www.002pc.com/python/3449.html

你可能感兴趣的python,下载,小说

什么组装电脑关于Python在Linux、Mac和Windows上的安装方法总结

一.Linux下安装python

1.python源码安装包下载地址:

https://www.python.org/downloads/source/

2.下载完tar.xz压缩包以后,开始解压

php 7.1 国内下载地址PHP文件下载类

//====================================================    电脑技术网认为此文章对《php 7.1 国内下载地址PHP文件下载类》说的很在理,www

mysql 查出数据一对多python使用unittest测试接口步奏详解

这次给大家带来python使用unittest测试接口步奏详解,python使用unittest测试接口的注意事项有哪些,下面就是实战案例,一起来看一下。

ie8浏览器官方下载 win7Windows7中如何批量修改文件属性

问:以前我用Windows XP时,因嫌显示器上的字小,所以将小说下载到本地硬盘,再修改源文件,将字体放大后再看。现在我新买了一台电脑,预装的是Windows 7 家庭普通版,却发现文件的

linux math 库下载命令wget怎么使用

wget是一个从网络上自动下载文件的自由工具,那么大家知道下载命令wget怎么使用吗?下面小编就为大家带来了下载命令wget使用的方法。下载命令wget使用方法wget 是一个命令

linux内核代码完全注释Python 3.4.0 beta 2 发布,修复多个bug

Python 3.4.0 beta 2 发布,此版本包括对 3.x 系列的改进和一些小的 bug 修复。

cf电脑下载官方下载Nginx学习笔记之Nginx介绍与安装

002pc.com认为此文章对《cf电脑下载官方下载Nginx学习笔记之Nginx介绍与安装》说的很在理。Nginx学习笔记之Nginx介绍与安装,有需要的朋友可以参考下。

php软件官网如何下载KindEditor在线文本编辑器使用

下载编辑器下载 KindEditor 最新版本,下载之后打开 examples/index.html 就可以看到演示。下载页面: http://www.kindsoft.net/down.php2.

杨幂电脑桌面壁纸微软 Windows 7 Beta 下载

Windows 7 Beta 32-bit English 下载地址:W WW.002pc .COM从杨幂电脑桌面壁纸微软 Windows 7 Beta 下载分析来看,对杨幂电脑桌面壁纸微软 Windows

linux get currentUbuntu 下载编译 Android5.0 源码

1.安装ubuntu编译Android 5.0 需要ubuntu 64位的操作系统,在 http://mirrors.ustc.edu.cn/ubuntu-releases/14.10/ 下载Ubuntu

0踩

0 赞

内容概要:本文详细介绍了一个基于秃鹰搜索算法(BES)优化最小二乘支持向量机(LSSVM)的多特征分类预测项目,涵盖从理论原理、模型架构、代码实现到GUI界面设计的完整流程。项目通过BES算法自动优化LSSVM的关键参数(如正则化参数C和核函数参数gamma),提升模型在高维、多特征数据下的分类精度与泛化能力。结合特征工程、交叉验证、数据增强等技术,有效应对过拟合与参数调优难题,并通过混淆矩阵、ROC曲线、t-SNE可视化等多种方式实现结果解释与模型评估。项目还提供了完整的目录结构、模块化代码封装、并行计算支持及可扩展的部署架构,适用于金融风控、医疗诊断、工业故障检测等多个领域。; 适合人群:具备一定Python编程基础和机器学习知识的研发人员、数据科学家及工程技术人员,尤其适合从事智能算法开发、模型优化与实际工程落地的相关从业者;工作年限建议在1-5年之间。; 使用场景及目标:①在高维多特征数据场景中实现高精度分类预测;②解决传统LSSVM人工调参困难的问题,实现参数自动寻优;③构建可解释、可可视化、可部署的智能分类系统,支持金融、医疗、工业等领域的智能决策应用;④学习如何将智能优化算法(如BES)与经典机器学习模型(如LSSVM)融合并实现端到端项目开发。; 阅读建议:建议读者结合文中提供的完整代码进行实践操作,重点关注BES优化算法的实现逻辑、LSSVM的训练流程以及GUI界面的集成方式。在学习过程中,可尝试更换数据集、调整参数范围或引入其他优化算法进行对比实验,以深入理解模型性能变化机制。同时,建议关注项目部署与可扩展性设计,为后续工程化应用打下基础。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值