2018年04月_ChaseRaod

07月 06月 05月 04月 03月 02月 01月

转载 python3正则表达式

正则表达式是一个很强大的字符串处理工具，它能帮助我们方便的检查一个字符串是否与某种模式匹配。一、python中正则表达式的基本语法规则序号语法解释表达式成功匹配对象 1 一般字符匹配自身相对应的字符 abc abc 2 . 匹配除换行符(\n)以外的任意字符 a.c abc 3 \ 转义字符，可以改变原字符的意思

2018-04-10 09:11:53 805

原创 python3中urllib中的request模块

因为在玩Python challenge的时候，有用过这个模块，而且学习这个模块之后也对系统学习网络爬虫有用。当时查了各种资料学习，没有碰官网文档（因为还是对英语有抗拒性），但是还是官方的文档最具权威和学习价值，因此想要此次翻译官方文档的同时，锻炼自己的英语能力，也对urllib模块加深理解。因为是为了自己复习起来...

2018-04-08 19:46:12 710

原创 urllib的parse模块

python 版本3.6 1.urlparse 定义：def urlparse(url, scheme=”, allow_fragments=True) 将url拆分成六大组件 #!/usr/bin/evn python "测试urlparse" #导入parse模块 from urllib import...

2018-04-08 19:26:27 563

原创 python爬虫基础二

上一篇博客中我们有提到，经过python爬虫去爬取服务器端的代码可能会被服务器阻拦，所以，我们要有措施来应对阻碍我们前进的障碍。当我们用python访问的时候，hearder中的User-Agent会显示python+版本号，我们可以通过修改它的值来达到隐藏的效果。在python爬虫基础一的博客中我们谈到爬取有道翻译的过程，在这个例子中我们加入隐藏字段： head = {} head...

2018-04-04 16:37:24 827

原创 python爬虫基础一

爬虫简介：爬虫就是一段自助抓取互联网信息的程序简单爬虫架构：我们用一段简单的代码爬取百度网页：但是上述爬取的结果只能给看得懂代码的程序员看，我们如何得到想要的图形化界面呢？下面我们试着从网站上爬取一个图片我们从网站http://placekitten.com上获取一张大小为500*600的图片爬取结果： response.geturl(）可以获取链接地址 resp

2018-04-04 13:30:09 653

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人