- 博客(4)
- 问答 (1)
- 收藏
- 关注
原创 某房产网信息爬取
有反爬,出现访问验证!穷人,手里没啥代理????! 因为是著名大站,所以只贴出部分,防止侵权或者非法用途等等,仅供学习交流,我也是个菜!愁人! class FtxSpider(scrapy.Spider): name = 'ftx' allowed_domains = ['fang.com'] start_urls = ['https://www.fang.com/SoufunFamily.htm'] def parse(self, response):
2020-05-09 14:03:18
243
1
原创 爬取图片网站
scrapy爬取,翻页是js加载的,所以采用scrapy-splash发送请求! 准备存储图片到本地,但是发现存储以后图片打不开,损坏了,然后复制图片地址在浏览器打开试一试,结果发现403禁止访问,应该是反爬,时而可以,时而不行,切换ip以后,依旧如此! 算了,还是把图片地址保存下来吧! main class MtSpider(scrapy.Spider): name = 'mt' ...
2020-05-03 21:39:41
998
1
原创 和xun基金排名爬取
from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys from selenium.webdriver.support import expected_conditions as EC from seleniu...
2020-04-26 11:50:01
224
原创 青春娱乐八卦板块爬取-交流学习,跪求大神指正
mian # -*- coding: utf-8 -*- import scrapy from qingchun_p.items import QingchunPItem from urllib.parse import urljoin from copy import deepcopy class QcSpider(scrapy.Spider): name = 'qc' a...
2020-03-30 09:14:36
171
空空如也
robotframework-ride关键词如何提示
2020-10-26
TA创建的收藏夹 TA关注的收藏夹
TA关注的人