- 博客(4)
- 资源 (1)
- 收藏
- 关注
转载 [Python]网络爬虫:百度贴吧的网络爬虫(v0.4)源码及解析
百度贴吧的爬虫制作和糗百的爬虫制作原理基本相同,都是通过查看源码扣出关键数据,然后将其存储到本地txt文件。 源码下载: http://download.csdn.net/detail/wxg694175346/6925583 项目内容: 用Python写的百度贴吧的网络爬虫。 使用方法: 新建一个BugBaidu.py文件,然后将代码复制到里面后,双击
2014-02-18 10:50:44 974
转载 [Python]网络爬虫:糗事百科的网络爬虫(v0.2)源码及解析
源码下载: http://download.csdn.net/detail/wxg694175346/6925583 项目内容: 用Python写的糗事百科的网络爬虫。 使用方法: 新建一个Bug.py文件,然后将代码复制到里面后,双击运行。 程序功能: 在命令提示行中浏览糗事百科。 原理解释: 首先,先浏览一下糗事百科的主页:http
2014-02-18 10:49:35 910
转载 Python中的正则表达式
接下来准备用糗百做一个爬虫的小例子。 但是在这之前,先详细的整理一下Python中的正则表达式的相关内容。 正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器。 一、 正则表达式基础 1.1.概念介绍 正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。 其他编程语言中也有
2014-02-18 10:45:27 690
转载 Python 列表(list)、字典(dict)、字符串(string)常用基本操作小结
创建列表 sample_list = ['a',1,('a','b')] Python 列表操作 sample_list = ['a','b',0,1,3] 得到列表中的某一个值 value_start = sample_list[0] end_value = sample_list[-1] 删除列表的第一个值 del sam
2014-02-11 11:49:44 737
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人