自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

转载 Scrapy摸索爬去New York Time

放上一个典型错误 编码错误 1 TypeError: can't concat bytes to str class TodaymoivePipeline(object): def process_item(self, item, spider): now=time.strftime('%Y-%m-%d',time.localtime()) ...

2017-09-25 08:02:00 196

转载 多线程爬取百度百科

前言:EVERNOTE里的一篇笔记,我用了三个博客才学完...真的很菜...百度百科和故事网并没有太过不一样,修改下编码,debug下,就可以爬下来了,不过应该是我爬的东西太初级了,而且我爬到3000多条链接时,好像被拒绝了...爬取速度也很慢,估计之后要接触一些优化或者多进程,毕竟python是假的多线程。本博客参照代码及PROJECT来源:http://kexue.fm/arch...

2017-09-04 23:24:00 105

转载 多线程版爬取故事网

前言:为了能以更高效的速度爬取,尝试采用了多线程本博客参照代码及PROJECT来源:http://kexue.fm/archives/4385/ 源代码: 1 #! -*- coding:utf-8 -*- 2 import requests as rq 3 import re 4 import time 5 import datetime ...

2017-09-03 08:30:00 147

转载 第一篇博客(python爬取小故事网并写入mysql)

前言:   这是一篇来自整理EVERNOTE的笔记所产生的小博客,实现功能主要为用广度优先算法爬取小故事网,爬满100个链接并写入mysql,虽然CS作为双学位已经修习了三年多了,但不仅理论知识一般,动手能力也很差,在学习的空余时间前前后后DEBUG了很多次,下面给出源代码及所遇到的BUG。   本博客参照代码及PROJECT来源:http://kexue.fm/archiv...

2017-08-31 23:17:00 84

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除