爬虫
daqinjun
hello world
展开
-
Python 模拟登陆
基于Python登陆学信网主要讲述账号密码登陆,cookie登陆, 主要知识点: 自动化测试工具selenium http请求方式 cookie介绍 代码实现 问题总结 1.selenium简介 selenium是一款自动化测试工具,它可以模拟很多人对电脑的操作,比如点击按钮,打开链接,关闭窗口,返回上一页面,滚动条的拖动等很多造作。这就大大提高了测试的效率,很多需要人去完成的测试原创 2017-06-19 21:20:41 · 805 阅读 · 0 评论 -
python 爬取12306验证码
一个简单的验证码爬取程序 本文介绍了在Python2.7环境下爬取网站验证码: 思路就是获取验证码对应的url,然后发起requst请求,读取该URL对应的内容,然后写入到一个本地文件,实现一个验证码的保存。大量下载可以把以上程序写入一个死循环 代码实现部分: import ssl import urllib2 i=1 import time while(1): #不加原创 2017-05-21 17:59:19 · 4968 阅读 · 7 评论 -
爬取百度贴吧照片
基于python的百度贴吧爬虫 # -*- coding: utf-8 -*- from bs4 import BeautifulSoup import urllib2 import urllib import re class imgTest: def __init__(self, baseUrl, seeLZ): self.baseUrl = baseUrl原创 2017-05-15 14:09:42 · 283 阅读 · 0 评论