- 博客(4)
- 收藏
- 关注
原创 爬取百度贴吧图片
贴吧图片遍历环境系统:win7、python27、工具:pycharmPython模块:urllib、urllib2、xpath需求爬取任意贴吧指定页面的图片并保存的本地需求分析以李毅吧为例:访问url地址:https://tieba.baidu.com/f?kw=%C0%EE%D2%E3&fr=ala0&tpl=5,后面的参数&fr=ala0&tpl=
2017-08-16 22:04:17 495
原创 xpath插件
概述xpath 啊,一门在xml文档中查找信息的语言,可以在xml中对元素和属性执行遍历。xpath使用路径表达式选择xml中的节点和节点集,这些表达式和平时我们电脑中的文件系统表达式类似。xpath内置函数xpath有100多个内置函数,这些函数用于字符串、数值、日期和时间比较。节点、Qname处理、序列、逻辑处理等等xpath节点xpath中有七种类型的节点:元素、属性
2017-08-12 09:54:35 459
原创 requests爬取小说
爬虫的小步骤:1.url解析2.发送请求3.接收返回4.进行解析5.存储小试牛刀需求:将国风中文网制定页的小说的题目、作者、最近更新章节和时间抓取下来保存到本地开始了小伙伴们,今天我们用的利剑是requests、xpath第一步:导入模块import requestsfrom lxml import etreeimport json第二步
2017-08-11 15:10:52 855
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人