python
文章平均质量分 80
顾大静
这个作者很懒,什么都没留下…
展开
-
Python实现网络爬虫
本人刚学Python不久,前段时间看到华南师范大学有一个网络爬虫的项目,特意研究了一下,用Python写了一个可以多线程下载的网络爬虫。其实网络爬虫的原理并不是太复杂,具体的一些东西可以参照百度百科的描述,在这里我就不再多说。我使用的网络爬虫下载网页的算法是广度搜索(BFS),网络上对爬虫实现算法的评价中,广度搜索的算法是排行第二的,最好的算法是按网页重要性排序后再确定下载顺序(这转载 2015-01-01 18:51:15 · 662 阅读 · 0 评论 -
Python提交表单并处理返回结果
1、将本地文件内容批量提交到指定网址,并将结果保存到本地import urllib import urllib2import cookielibcj = cookielib.LWPCookieJar()opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))urllib2.install_opene原创 2014-12-29 23:06:27 · 1235 阅读 · 0 评论