爬虫
daqinjun
hello world
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python 模拟登陆
基于Python登陆学信网主要讲述账号密码登陆,cookie登陆,主要知识点:自动化测试工具seleniumhttp请求方式cookie介绍代码实现问题总结1.selenium简介 selenium是一款自动化测试工具,它可以模拟很多人对电脑的操作,比如点击按钮,打开链接,关闭窗口,返回上一页面,滚动条的拖动等很多造作。这就大大提高了测试的效率,很多需要人去完成的测试原创 2017-06-19 21:20:41 · 907 阅读 · 0 评论 -
python 爬取12306验证码
一个简单的验证码爬取程序本文介绍了在Python2.7环境下爬取网站验证码:思路就是获取验证码对应的url,然后发起requst请求,读取该URL对应的内容,然后写入到一个本地文件,实现一个验证码的保存。大量下载可以把以上程序写入一个死循环代码实现部分:import sslimport urllib2i=1import timewhile(1): #不加原创 2017-05-21 17:59:19 · 5083 阅读 · 7 评论 -
爬取百度贴吧照片
基于python的百度贴吧爬虫# -*- coding: utf-8 -*-from bs4 import BeautifulSoupimport urllib2import urllibimport reclass imgTest: def __init__(self, baseUrl, seeLZ): self.baseUrl = baseUrl原创 2017-05-15 14:09:42 · 336 阅读 · 0 评论
分享