python爬虫开发
python爬虫
不负长风
这个作者很懒,什么都没留下…
展开
-
python爬取某乎专栏文章标题及URL
【代码】python爬取某乎专栏文章标题及URL。原创 2017-12-21 21:09:38 · 2779 阅读 · 0 评论 -
python模拟登录东北大学校园卡主页
# -*- coding:utf-8 -*-import requestsimport randomimport pytesseractfrom bs4 import BeautifulSoupfrom PIL import Imageimport lxmlx = requests.session()r = x.get('http://ecard.neu.edu.cn/Self原创 2017-12-21 21:11:47 · 1493 阅读 · 2 评论 -
python模拟登录东北大学校园IP网关
import requestsurl = 'http://ipgw.neu.edu.cn/srun_portal_pc.php?ac_id=1&'headers = { 'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8', 'Acce原创 2017-12-21 21:13:14 · 4383 阅读 · 6 评论 -
python模拟登录东北大学教务处
from selenium import webdriverfrom PIL import Imageimport pytesseractimport reimport timedriver = webdriver.PhantomJS()driver.get('https://aao.neu.edu.cn/')iframe = driver.find_element_by_ta原创 2017-12-21 21:16:09 · 1565 阅读 · 2 评论 -
python爬取淘宝商品数据
from selenium import webdriverfrom bs4 import BeautifulSoupimport lxmlimport reimport timedriver = webdriver.Chrome()driver.get('https://www.taobao.com/')q = driver.find_element_by_id('q')q原创 2018-01-12 22:27:11 · 1565 阅读 · 0 评论 -
python爬虫:遍历一个网站
通过维护url集合来实现。对于如下http://www.lueur.cn/example.php?id=1http://www.lueur.cn/example.php?id=2...http://www.lueur.cn/example.php?id=n做了去重处理,只显示其中的一条。异常处理的代码比较少。附代码。以爬取杭电oj为例。# -*- coding:utf-8 -*-import r...原创 2018-06-19 12:03:43 · 17295 阅读 · 2 评论 -
python实现qq空间自动点赞
项目github地址:https://github.com/bufuchangfeng/qzone使用python实现qq空间自动点赞功能。需自行安装库并配置环境。我想实现的是每6个小时就自动更新一次cookie。这也是和网上其他版本相比具有的优点。不用手动输入cookie。更加自动。(不负责任的说,这个功能没有测试过。) 程序运行方法:将代码存为.py文件,运行即可。输入...原创 2018-10-09 10:03:29 · 13631 阅读 · 9 评论