- 博客(8)
- 收藏
- 关注
原创 爬取学校教务系统学生课表
爬取课表在脚本的完成下显得十分简单 一 在打开南邮研究生教务网站是登录一下,并打开chrome的审查元素的network发现 登录时请求的url和所提交表单的数据email和assword 二 在打开课表查询的页面是我们发现 有一个保存为excel文件的button,我点开发现 浏览器向这个url发出了post,提交的表单是 第一个是判断是否要服务器发送课表的e
2016-03-04 09:40:57 2242
原创 黑板客爬虫闯关第四关
我们随便输入一个密码后看到 意思是在13个页面中有密码和密码的位置,也就是说密码共100位但是页面中给出的值是随机密码,也有可能是重复的,所以要把网页中的1-100位的密码全部读出来(不仅是要把这13个页面的密码读取一遍)因为是随机的 所以要不断的读取直到凑够100位。。。但这样做程序运行特别慢(大概要15分钟)
2016-03-01 20:22:26 577
原创 知乎登陆脚本
改脚本模拟了用浏览器登录知乎 首先浏览器再申请打开网页(访问服务器时)会向服务器发送get post请求,主要是以报文的形式传输,首先看看浏览器的工作过程 1 在打开知乎时浏览器发送到报文是 2 在登陆时 填写好信息后发送的是_xsrf,password,remember_me,email所以只要用脚本带为发送这些即可 脚本部分: 在python用urllib包里的模块来提供一系列用
2016-02-27 11:50:00 670
原创 使用sqlite数据库来管理数据
python自带有sqlite数据库,只需要在firefox上加载sqlite manager就可以有视图化的数据库 也就是将以前通过pickle来进行数据的IO变为通过数据库来进行IO。 数据库的建立 同时建立了两张表athlete(储存姓名和生日)和timing_data(储存时间) 两张表通过id和anthlete_id连接 将以前的pickle数据传到数据库当中,
2015-11-26 17:01:16 240
原创 webapp开发的小案例
所用的结构是MVC(model view controllor) 一 M 用于储存web应用数据的代码 put_to_store是读取数据并保存为pickle文件 get_from_store是将pickle文件转为并返回为字典类型的数据(字典里保存的是继承list的类具体如下) 二 V 也就是关于UI(user interface)的代码,在web开发中由标记语言HTM
2015-11-22 19:55:50 1063
原创 小案例:取成绩的前三名(字典)
用字典(数据结构)把键与数据相关联(list和集合是用数字和数据相关联) 定义字典用‘{}’或‘dict()’初始化和list差不多只不过把数字换为字符串如sbw['name']='sbw'
2015-11-20 18:25:12 204
原创 文件的读取
1 读取文本文件之前要把文件放入能读取的路径之中,可以用"os"库中的函数os.chdir可以把当前工作目录切换为包含数据文件的文件夹。(os.getcwd()可以查看工作目录) 2 open()方法打开文件,创建一个迭代器,一次读取一行 readline()方法读取一行数据 seek()方法将文件退回起始位置 close()方法关闭之前打开的文件 split()可根据括号里的将一行分
2015-11-10 21:45:23 200
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人