爬虫
eiffel_0311
这个作者很懒,什么都没留下…
展开
-
scrapy hello world
1. 安装:pip install Scrapy2. 新建工程scrapy startproject myspider3. 测试spiders 目录下新author_spider.py:import scrapyclass AuthorSpider(scrapy.Spider): name = 'author' def start_requests(sel...原创 2019-04-01 10:04:04 · 17505 阅读 · 0 评论 -
csdn 访问刷榜
原理: 通过访问文章的次数,提高访问次数,从而提高积分和排名环境: ubuntu 18.04, scrapy 框架目的: 纯属好奇1. 创建爬虫:csdnblog_spider.py# coding: utf8import scrapyclass CsdnblogSpider(scrapy.Spider): name = 'csdn' def start_r...原创 2019-01-31 09:16:26 · 80980 阅读 · 1 评论 -
selenium 动态填充表单, 模拟鼠标右键保存图片
1. 下载驱动,解压驱动(测试环境ubuntu 18.04)http://npm.taobao.org/mirrors/chromedriver/ 2. 代码import org.openqa.selenium.*;import org.openqa.selenium.chrome.ChromeDriver;import org.openqa.selenium.chrom...原创 2019-02-15 14:25:59 · 59987 阅读 · 0 评论 -
短网址简介
1. 什么是短网址?短网址也就是比较短的网址,其功能是把短网址压缩,例如:把https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=%E4%BA%94%E4%B8%80%E6%94%BE%E5%81%87&oq=react%2520color&rsv_pq=9...原创 2019-04-23 16:13:28 · 9907 阅读 · 1 评论