爬一爬xxx学校的教务网站

爬一爬!

仅仅记录一下一个java狂热者在python中的爬路经历。

谈谈自己对Java和Python在网络编程方面的感受: 曾经的我在java中写过不少爬虫,代码量非常的大(毕竟静态语言非得事先声明),而且post过程及其复杂,对cookie的操作也显得特别混乱(但是java的代码结构还是依然的清晰,有条有理。这也是动态语言不能超越的)。最近看了python中的网络编程,感叹其简洁性,曾经HttpUrlConnection或者HttpClient复杂的connect过程在python中仅一行代码urlopen。这真的是让我措手不及。废话少说....

我使用的是Python3.5,之前用2.7写过一次,使用的是url lib,urllib2,cStringIO。但是将源代码转换到python3.5之后,异常纷飞。

所以这里简要说明一下版本间的模块的对应关系:

python2.x,3.x对比
python2.7 python3.5
urllib url lib.parse
urllib2 url lib.request
cStringIO io
PIL.Image Image

思路:

1.先去xxx教务网站抓包,看一下我们网络请求所需要的数据。(chrome自带工

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值