自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

淡泊

千里之行始于足下

  • 博客(6)
  • 收藏
  • 关注

原创 requests多进程爬取今日头条街拍--记录

spider.py#!/usr/bin/env python#-*- coding:utf-8 -*-import requestsimport reimport jsonimport pymongoimport osfrom requests.exceptions import RequestExceptionfrom urllib.parse import urlen

2018-01-13 07:03:36 1354

转载 requests爬猫眼电影 -- 记录

#!/usr/bin/env python#-*- coding:utf-8 -*-import requestsimport refrom requests.exceptions import RequestExceptionfrom json import dumpsdef get_one_page(url): try: response = requests.

2018-01-13 02:13:48 294

原创 requests爬小猪租房存入Mongodb--记录

#!/usr/bin/env python#-*- coding:utf-8 -*-import requests,time,pymongofrom bs4 import BeautifulSoupheaders = { "User-Agent":'Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922

2018-01-03 14:38:58 337

原创 requests爬取图片保存--记录

#!/usr/bin/env python#-*- coding:utf-8 -*-import requests,time,osfrom bs4 import BeautifulSoupheaders = { "User-Agent":'Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922 Ubunt

2018-01-02 16:39:30 2713

原创 requests爬取小猪租房--记录

#!/usr/bin/env python#-*- coding:utf-8 -*-import requests,timefrom bs4 import BeautifulSoupheaders = { "User-Agent":'Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922 Ubuntu/1

2018-01-02 12:38:37 395

原创 Scrapy 爬豆瓣--记录

# -*- coding: utf-8 -*-import scrapyimport ConfigParserimport reclass MovieSpider(scrapy.Spider): download_delay = 1 #防止IP被封,设置爬取时间 config = ConfigParser.RawConfigParser() #RawConfigParser

2017-12-31 02:42:39 242

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除