关闭

[Python]网络爬虫:百度贴吧的网络爬虫(v0.4)源码及解析

百度贴吧的爬虫制作和糗百的爬虫制作原理基本相同,都是通过查看源码扣出关键数据,然后将其存储到本地txt文件。 源码下载: http://download.csdn.net/detail/wxg694175346/6925583 项目内容: 用Python写的百度贴吧的网络爬虫。 使用方法: 新建一个BugBaidu.py文件,然后将代码复制到里面后,双击...
阅读(758) 评论(0)

[Python]网络爬虫:糗事百科的网络爬虫(v0.2)源码及解析

源码下载: http://download.csdn.net/detail/wxg694175346/6925583 项目内容: 用Python写的糗事百科的网络爬虫。 使用方法: 新建一个Bug.py文件,然后将代码复制到里面后,双击运行。 程序功能: 在命令提示行中浏览糗事百科。 原理解释: 首先,先浏览一下糗事百科的主页:http...
阅读(702) 评论(0)

Python中的正则表达式

接下来准备用糗百做一个爬虫的小例子。 但是在这之前,先详细的整理一下Python中的正则表达式的相关内容。 正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样,是必不可少的神兵利器。 一、 正则表达式基础 1.1.概念介绍 正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。 其他编程语言中也有...
阅读(526) 评论(0)

Python 列表(list)、字典(dict)、字符串(string)常用基本操作小结

创建列表   sample_list = ['a',1,('a','b')]      Python 列表操作   sample_list = ['a','b',0,1,3]      得到列表中的某一个值   value_start = sample_list[0]   end_value = sample_list[-1]      删除列表的第一个值   del sam...
阅读(583) 评论(0)
    个人资料
    • 访问:126759次
    • 积分:1934
    • 等级:
    • 排名:千里之外
    • 原创:60篇
    • 转载:30篇
    • 译文:0篇
    • 评论:19条
    最新评论