自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Scrapy框架抓取豆瓣电影的小爬虫学习日记(三)

获取到影片信息之后,下一步就是要把获取到的信息进行保存了。网上很多的案例都是保存成json格式,这里我想用Mysql服务器来保存。

2017-10-27 14:33:05 336

原创 Scrapy框架抓取豆瓣电影的小爬虫学习日记(二)

爬虫模块创建完成后,仅仅拥有了网页下载功能,接下来就需要进行网页数据的提取。 Scrapy有自己的一套数据提取机制,叫做选择器(selector),是通过特定的XPath或者CSS表达式来选择HTML文件中的某个部分。不过我之前主要使用的是BeautifulSoup包来解析网页,所以这里还继续用了BeautifulSoup,感兴趣的同学可以去找文章看看XPath的方法。

2017-09-11 13:07:28 417

原创 Scrapy框架抓取豆瓣电影的小爬虫学习日记(一)

安装完Scrapy框架,就很想试一下,平时对电影感兴趣,于是想着去豆瓣电影爬取一些电影资料,和我若干T的电影资源对接一下,哈哈!

2017-09-07 10:05:55 404

原创 Win10环境Python3.6安装Scrapy1.4(好多坑)

最近刚刚开始学习Python,先看了一些Python爬虫技术的文章,其中很多人都提到了Scrapy框架,于是想安装学习一下,结果弄了好久,遇到了各种坑,找了各种方法,终于填完。写下此文,希望对后来的小伙伴有些帮助。         我的系统环境是Win1064位,安装了Python3.6。         先说一下我遇到的几个大坑:         1、Scrapy1.4是支

2017-09-05 16:34:06 4988 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除