自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 问答 (1)
  • 收藏
  • 关注

原创 某房产网信息爬取

有反爬,出现访问验证!穷人,手里没啥代理????! 因为是著名大站,所以只贴出部分,防止侵权或者非法用途等等,仅供学习交流,我也是个菜!愁人! class FtxSpider(scrapy.Spider): name = 'ftx' allowed_domains = ['fang.com'] start_urls = ['https://www.fang.com/SoufunFamily.htm'] def parse(self, response):

2020-05-09 14:03:18 243 1

原创 爬取图片网站

scrapy爬取,翻页是js加载的,所以采用scrapy-splash发送请求! 准备存储图片到本地,但是发现存储以后图片打不开,损坏了,然后复制图片地址在浏览器打开试一试,结果发现403禁止访问,应该是反爬,时而可以,时而不行,切换ip以后,依旧如此! 算了,还是把图片地址保存下来吧! main class MtSpider(scrapy.Spider): name = 'mt' ...

2020-05-03 21:39:41 998 1

原创 和xun基金排名爬取

from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys from selenium.webdriver.support import expected_conditions as EC from seleniu...

2020-04-26 11:50:01 224

原创 青春娱乐八卦板块爬取-交流学习,跪求大神指正

mian # -*- coding: utf-8 -*- import scrapy from qingchun_p.items import QingchunPItem from urllib.parse import urljoin from copy import deepcopy class QcSpider(scrapy.Spider): name = 'qc' a...

2020-03-30 09:14:36 171

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除