- 博客(5)
- 收藏
- 关注
转载 python3正则表达式
正则表达式是一个很强大的字符串处理工具,它能帮助我们方便的检查一个字符串是否与某种模式匹配。一、python中正则表达式的基本语法规则 序号 语法 解释 表达式 成功匹配对象 1 一般字符 匹配自身相对应的字符 abc abc 2 . 匹配除换行符(\n)以外的任意字符 a.c abc 3 \ 转义字符,可以改变原字符的意思
2018-04-10 09:11:53 805
原创 python3中urllib中的request模块
因为在玩Python challenge的时候,有用过这个模块,而且学习这个模块之后也对系统学习网络爬虫有用。 当时查了各种资料学习,没有碰官网文档(因为还是对英语有抗拒性),但是还是官方的文档最具权威和学习价值,因此想要此次翻译官方文档的同时,锻炼自己的英语能力,也对urllib模块加深理解。 因为是为了自己复习起来...
2018-04-08 19:46:12 710
原创 urllib的parse模块
python 版本3.6 1.urlparse 定义:def urlparse(url, scheme=”, allow_fragments=True) 将url拆分成六大组件 #!/usr/bin/evn python "测试urlparse" #导入parse模块 from urllib import...
2018-04-08 19:26:27 563
原创 python爬虫基础二
上一篇博客中我们有提到,经过python爬虫去爬取服务器端的代码可能会被服务器阻拦,所以,我们要有措施来应对阻碍我们前进的障碍。 当我们用python访问的时候,hearder中的User-Agent会显示python+版本号,我们可以通过修改它的值来达到隐藏的效果。 在python爬虫基础一的博客中我们谈到爬取有道翻译的过程,在这个例子中我们加入隐藏字段: head = {} head...
2018-04-04 16:37:24 827
原创 python爬虫基础一
爬虫简介: 爬虫就是一段自助抓取互联网信息的程序 简单爬虫架构: 我们用一段简单的代码爬取百度网页: 但是上述爬取的结果只能给看得懂代码的程序员看,我们如何得到想要的图形化界面呢? 下面我们试着从网站上爬取一个图片 我们从网站http://placekitten.com上获取一张大小为500*600的图片 爬取结果: response.geturl()可以获取链接地址 resp
2018-04-04 13:30:09 653
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人