- 博客(9)
- 收藏
- 关注
原创 JAVA简易控制台选择题答题,改自书上代码
读出txt文件中按一定规则存储的题目,以2017年的一次软考题目为例。效果如下:StandardExam.javapackage com.company.com.fancy; import java.io.*; import java.util.Scanner; import java.util.regex.Matcher; import java.util.regex.Pattern; //简易...
2018-04-21 22:27:54
6070
1
原创 scrapy使用selenium中间件 爬取半次元图片
spider.py# -*- coding: utf-8 -*- import scrapy import logging,time from sec_bcy.items import BcyItem class BcyspiderSpider(scrapy.Spider): name = 'bcySpider' page_index = 2 url='https:/...
2018-04-01 22:22:29
898
原创 scrapy爬取豆瓣“选电影”各分类中的电影信息
分类中电影的详细链接可在ajax返回的json中查看。spider.py:# -*- coding: utf-8 -*- import scrapy,json from urllib.parse import quote from sec_douban.items import SecDoubanItem class SpidermovieSpider(scrapy.Spider): na...
2018-03-25 20:49:46
1035
原创 Scrapy 粗略爬取豆瓣影视相关信息
douban.py# -*- coding: utf-8 -*- import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlSpider, Rule from crawl_douban.items import CrawlDoubanItem class Douba...
2018-03-24 17:00:15
307
原创 PY27 RE匹配 输入账号密码获取盐城工学院教务系统成绩
# coding:utf-8 # 盐工教务系统 import urllib2,urllib import cookielib,re #临时存储学生cookie stuCookie='' #声明一个CookieJar对象实例来保存cookie cookie = cookielib.CookieJar() #利用urllib2库的HTTPCookieProcessor对象来创建cookie处理器 ...
2018-03-24 16:48:06
1472
1
转载 python多线程threading基本案例
# coding:utf-8 import threading,requests,json from Queue import Queue # empty put get from lxml import etree CRAW_EXIT=False PARSE_EXIT=False total=1 class ThreadCrawl(threading.Thread): def __i...
2018-03-24 16:43:52
391
原创 Scrapy默认spider爬取熊猫星颜主播头像
pandaSpider.py# -*- coding: utf-8 -*- import scrapy,json from crawl_pandatv.items import PandatvItem import logging class PandaspiderSpider(scrapy.Spider): name = 'panda' allowed_domains = ['...
2018-03-24 16:39:42
364
转载 Scrapy CrawlSpider demo
dongguan.py# -*- coding: utf-8 -*- import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlSpider, Rule from lx_dongguan.items import LxDongguanItem class Donggu...
2018-03-24 16:35:05
195
原创 python3 selenium xpath 下载斗鱼颜值主播头像 入门demo
#coding:utf-8 #下载斗鱼主播图片 from selenium import webdriver from selenium.webdriver.chrome.options import Options from lxml import etree import requests import time #设置使用chrome headless chrome_options = O...
2018-03-19 20:17:08
452
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人