![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python爬虫学习
Pory
这个作者很懒,什么都没留下…
展开
-
简单调试 Python 程序
在 Python 中也可以像 gcc/gdb 那样调试程序,只要在运行 Python 程序时引入 pdb 模块(假设要调试的程序名为 d.py):$ vi d.py#!/usr/bin/pythondef main(): i, sum = 1, 0 for i in xrange(100): sum = sum + i转载 2014-10-26 19:53:06 · 479 阅读 · 0 评论 -
Lubuntu14.04(Ubuntu)安装爬虫框架Scrapy
Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结 Scrapy Pthyon爬虫框架 logo[1]构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了w原创 2014-10-20 20:22:23 · 1014 阅读 · 0 评论 -
64位win7系统下面安装pyOpenSSL一直报错找不到openssl/aes.h解决方法
最近想装一个scrapy玩下爬虫,虚拟机Linux下面倒是很好安装,但在windows下要安装原创 2014-10-21 19:52:11 · 6210 阅读 · 0 评论 -
豆瓣电影搜索爬虫程序,爬虫小程序,适合初学者
最近在学python,之前用Python写过简单的图片爬取,今天想着用python爬一下豆瓣的电影,就有了下面的程序:#coding:utf-8import reimport sysimport urllibfrom bs4 import BeautifulSoupdef movieSearch(): douBanSearchurl = "http://movie.douban.c原创 2014-10-28 21:50:59 · 2454 阅读 · 0 评论 -
Python Version 2.7 required which was not found in the registry
安装setuptools的时候,不能再注册表中识别出来python2.7在网上找了方法,仅作笔记,供下次使用 方法: 新建一个register.py 文件,把一下代码贴进去,保存(G盘) 按 Ctrl+C 复制代码安装setuptools的时候,不能再注册表中识别出来python2.7在网上找了方法,仅作笔记,供下次使用转载 2014-10-18 19:44:36 · 646 阅读 · 0 评论 -
python Scrapy 框架做爬虫 ——很好的教程
写在前面:因为网络上关于Scrapy的使用经验已经非常多,本文无意重复或复制,只做思路导引和资源索引之用。如果你一头扎进来正毫无头绪,那么恭喜你,你找到了路标!非常感谢Young-hz所写的Scrapy框架探索系列博客,在这里主要引用了他的博客链接。一,初识爬虫因为一个兴趣项目,需要爬取网上的数据,因而接触学习了网络爬虫。爬虫的思路非常清晰:按照转载 2014-10-21 14:32:28 · 1302 阅读 · 0 评论 -
Python正则表达式指南
本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。注意:本文基于Python2.4完成;如果看到不明白的词汇请记得百度谷歌或维基,whatever。尊重作者的劳动,转载请注明作者及原文地址 >.html1. 正则表达式基础转载 2014-10-21 21:39:47 · 551 阅读 · 0 评论