qpython编写爬虫_Python - 用 PyQt 写爬虫界面

打开压缩包会看到四个文件。

使用说明已经简单交代了软件的用法。

templete.xls 和 data.txt 文件可以先忽视,后续会交代这两个文件的作用。

先打开 pyYouthExcel-ver2.0.exe

初次打开软件会看到两个窗口。

左边黑乎乎的窗口是控制台

当程序出错或者无响应的时候,可以通过控制台看到反馈的信息。

右边的窗口就是程序的主界面。

这个界面就是软件主界面

最上面是数据获取设置,清除掉输入框中的文本可以看到输入提示。

没错,这里获取的就是文件夹中的两个文件信息。

当然也可以自己创建相关的文件,点击选择可以选到相关的路径中

获取完之后,界面会出现完整的路径

这个路径和之前的 data.txt 路径有什么不同效果吗?

其实两个路径都实现了相同的功能。

路径很长的称之为绝对路径,从盘符开始索引。

路径很对的称之为相对路径,从当前程序所在的目录开始索引。

下面就是 输入网页URL 的区域了

这里可以将青年之声的提问链接输入进去

当然也可以输入多条链接,链接之间用回车分行即可

再下面就是选择文件保存路径

基本操作相信也不用说明了,直接输入文件名称则以相对路径保存到当前程序启动目录中。

确认输入无误之后,点击一键统计。

执行完毕之后可以在目录中看到多了两个文件

其实只是多出了生成文件, qt.conf 文件在打开程序之后自动生成,不影响使用。

下面打开 test.xls 文件

所有的统计操作都通过程序完成了。

程序操作讲解完毕,重点来看看配置文件都是什么吧

data.txt 存储的是同学的相关信息

另外有一个快捷的操作,务必使用此方法。

在Excel上复制同学们的信息

可以直接粘贴到txt文档中

代码背后会识别这个间隔,输入正确才能让程序正确运行。

手动输入这个间隔 不是按空格 而是按键盘 Tab 键

!!! 这里输入的姓名是指 青年之声用户名 !!!

如果用户名与真实姓名不一致 请输入 青年之声用户名 !!!

程序会根据 输入的用户名进行匹配 !!!

输入不匹配就不会输出 合格 !!!

请务必检查清楚 !!!

最后就是 templete.xls 了

其实这个文件只是获取它的基础板式

如果不想要这个基础板式,可以去掉配置文件的索引。

这样子生成的就是配置文件部分的 Excel 文档

代码分析,源代码这个部分与软件使用无关,只是个人总结一下代码编写的过程。

下面贴出软件的源码

from PyQt4.QtCore import *

from PyQt4.QtGui import *

import sys

import re

import xlwt

import

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值