爬虫
文章平均质量分 58
Aliz_
大学生
展开
-
爬虫(一)request和BeautifulSoup
先说明,我也是新手。我也是昨晚突然有兴趣才看的爬虫。我是在知乎找的教程。改动很少(有一句扑街了,我改了)。主要是想记录理解的东西。Show the Code:import requestsfrom bs4 import BeautifulSoupcomments = []r = requests.get('http://tieba.baidu.com/f?kw=%E5%8D%8E%...原创 2018-08-05 15:25:37 · 5484 阅读 · 2 评论 -
爬虫(二)selenium爬二手房
我决定爬房价。因为原本的教程,后面也是爬58同城,我也就跟着爬了。不过这次,我是基本都改了。其实一开始很快就写好了,但是第二页开始就要输入验证码了。我查了下,说selenium可以规避这个问题,我就去安装了这个库。但是还有很多得需要提前安装。 (代码在最下面)chromedriver下载地址:http://chromedriver.storage.googleapis.com/inde...原创 2018-08-05 19:40:57 · 636 阅读 · 0 评论 -
爬虫(三)lxml+requests(豆瓣Top250电影)
回家之后就不想学习了…这次用的是lxml库,因为听说比起BeautifulSoup它的速度更快,然后就想了解一下。(全部的代码在最下面)import库from lxml import etreeimport requestsimport json# from time import sleep这是要用到的库。requests请求html,lxml解析html文档,然后得到的数...原创 2018-08-19 20:57:03 · 592 阅读 · 0 评论 -
爬虫(四)selenium添加购物车(cookies)
上一篇关于selenium的文章其实只是通过它来得到网页代码,然后用BeautifulSoup来进行信息的查找。这一次也不复杂,只是通过selenium自带的CSS选择器来选择按钮,然后点击选入购物车。这次模拟的是抢购的场景,也就是设定时间,然后自行选购。(emmm,好吧,就是按键精灵低级版,虽然我也没用过按键精灵)from selenium import webdriverfrom s...原创 2018-08-21 21:27:01 · 1403 阅读 · 0 评论 -
制作简易词典(PyQt5+爬虫)
在查看剑桥词典网页版的时候,逼着自己看英英,但有时候看不懂还得打开英汉的页面。 然后,就自己查了点界面的知识,结合前面学的一点爬虫,捣鼓了一下。 放在这里~~~先说明,我也是新手。from PyQt5.QtWidgets import QApplication, QToolTip, QPushButton, QMessageBox, QDesktopWidget, \ QMai...原创 2018-08-25 00:12:30 · 1139 阅读 · 0 评论