自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Kosmoo的博客

记录自己学习python过程中的经验与心得

  • 博客(4)
  • 资源 (7)
  • 收藏
  • 关注

原创 scrapy爬虫的搭建过程(实战篇)

scrapy爬虫的搭建过程(实战篇) 1. 爬虫功能 以 http://bbs.fengniao.com/forum/forum_125_1_lastpost.html 为起始页,爬取前十页的信息,包括文章的标题、链接地址和图片地址,保存到mongodb中。并下载对应的图片到本地目录。 2. 环境 系统:win7 Scrapy 1.4.0 mongodb v3.2 pyt...

2018-02-08 14:40:25 5639 1

原创 scrapy爬虫的搭建过程(理论篇)

scrapy爬虫的搭建过程(理论篇) 1. 概述 Scrapy是一个纯Python实现的,为了爬取网站数据、提取结构化数据而编写的应用框架,用途非常广泛。只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页的内容以及各种图片,非常方便。 Scrapy 使用了 Twisted (其主要对手是Tornado)异步网络框架来处理网络通讯,可以加快我们的下载速度,不用自己去实现异步框架,...

2018-02-08 09:05:52 4221

原创 python + selenium + chrome 在实现back,forward,refresh时的注意事项

python + selenium + chrome 在实现back,forward,refresh时的注意事项 1. 背景 在使用selenium模拟浏览器时,经常会使用到导航栏的三个按钮:后退,前进,刷新。来达到在浏览过的页面之间进行切换。对应到selenium中的方法分别是:back(),forward(), refresh() 。但是如果直接使用之前定位到的元素,会出现一个问题,那

2018-02-06 11:15:27 5239

原创 python + selenium + chrome 如何操作滚动条

python + selenium + chrome 如何操作滚动条 1. 背景 在使用selenium模拟浏览器时,经常会需要下拉滚动条,一般是有两个目的: 拟人操作,突破精妙的反爬系统。 有些元素正常情况下不加载出来,需要拖动下拉条,才能慢慢加载出来,类似于淘宝这样的网站。 2. 环境 python 3.6.1 系统:win7 IDE:pycharm 安装过chrome浏览

2018-02-05 17:46:50 27664

python面试题大全

主要是一些大公司,网上流传的python岗位面试题,主要体现在python的语言特性上,比较基础

2018-03-26

SVN安装与详细使用教程

SVN安装与详细使用教程,包含了 SVN服务器(VisualSVN server)搭建和使用,SVN客户端(Tortoise SVN)的安装配置,以及客户端的详细使用,以及注意事项

2018-02-09

Python网络编程基础

Python网络编程基础

2017-02-15

C经典100例的python实现

C经典100例的python实现

2017-02-15

Django中文手册

Django 中文手册

2017-02-15

Python经典面试题

Python经典面试题

2017-02-15

python340参考手册_英文

python340参考手册_英文

2017-02-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除